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(57) Abstract: The invention relates to expression cassettes, combinations thereof and x-cctors containing said expression cassettes, 
containing plant promoters with an expression specificity for plant seeds, in particular linseed and the use of said expression cas- 
settes or vectors for the recombinant expression of heterologous genes in plants. The invention further relates to transgenic plants, 
transformed by means of said expnsssion cassettes, or vectors, cultures, parts or transgenic propagations derived thercfioni and the 
use of the above as foodstuff, animal feedstuff, seedstuff, pharmaceuticals, fine chemicals or industrial raw material. 
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• — (57) Zusammenfassung: Die Erfindung bcrriffr Exprcssionskasscitcn, dcrcn Kombination und Vektorcn cnthaltcnd die Expressi- 
onskassetten. die pflanzliche Promotoren mit einer Expressionsspezifitat fiir pflanzliche Samen insbesondere Leinsamen enthalten, 
suwie die Venvendung dieser Expressiunskussetten oder Vekturen £ur rekumbinunlen Expression helerologer Gene in Pflun^n. 

Q Die Erfindung betrifft femcr mil diesen Expressionskassetten oder Vektoren transformierte transgene Pflanzen, davon abgeleitetc 
Kulniren, Teile oder transgenes Vermehrungsgut, sowie die Verwendung derselben als Nahrungs-, Futtermittel oder Saaigut, Phar- 

^ ma/futika, Feinchemikalien oder als industrielfer Grund.stofr. 
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Verfahren zur Expression von Biosynthesegenen in pf lanzlichen Sa- 
itien unter Verwendung von neuen multiplen Express ionskonstrukten 

5 Beschreibung 

Die Erfindxmg betrifft Expressionskassetten, deren Kombination 
\md Vektoren enthaltend die Expressionskassetten, die pflanzliche 
Promotoren mit einer Expressionsspezif itat fur pflanzliche Samen 

10 insbesondere Leinsamen enthalten, sowie die Verwendung dieser Ex- 
pressionskassetten Oder Vektoren zur rekombinanten Expression he- 
terologer Gene in Pflanzen. Die Erfindung betrifft ferner mit 
diesen Expressionskassetten oder Vektoren trans formierte trans- 
gene Pflanzen, davon abgeleitete Kulturen, Telle oder transgenes 

15 Vermehrungsgut/ sowie die Verwendung derselben als Nahrungs-, 
Futtermittel oder Saatgut, Phannazeutika, Feinchemikalien oder 
als Indus trieller Grundstoff . 

Die erfinduhgsgemaiSen Expressionskassetten werden vorteilhaft in 

20 einem Verf^ren zur Herstellung von ungesattigten Fettsauren mit 
mindestens zwei Doppelbindungen und/oder ein Verfahren zur Her- 
stellung von Triglyceriden mit erhohtem Gehalt an mehrfach unge- 
sattigten Fettsaiiren mit mindestens zwei Doppelbind^lngen verwen- 
det. Im Verfahren finden vorteilhaft die Nukleinsauresegrienzen 

25 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder 11 Anwendung, die 
•unter Verwendung der Expressionskassetten exprimiert werden. 
Diese vorgenannten NukleinsSuren sind im Verfahren. sowie zur Her- 
stellung eines transgenen Organismuses bevorzugt einer transgenen 
Pflanze oder eines transgenen Mikroorganismus mit erhohtem Gehalt 

30 an FettsSuren, Olen oder Lipiden mit ungesattigten Cie-/ C20-/ 

oder C22-Fettsauren geeigriet. Aufierdem kSnnen mit Hilfe der erf in- 
dungs gemaSen Expressionskassetten v/eitere Gene neben den Nuklein- 
. saureseguenzen SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 und 
SEQ ID NO: 11 Oder seine Homolcgen, Derivate oder Analoga sowie 

35 Genkonstrukte, die diese Gene oder ihre Homologen, Derivate oder 
Analoga umfasst, sowie Ihre Verwendung allein oder in Kombination 
mit weiteren Biosynthesegenen bevorzugt Biosynthesegene fiir poly- 
ungesSttigter FettsMuren, wie vorteilhaft in SEQ ID NO: 7 und SEQ 
ID NO: 9 dargestellt, in Grganismen bevorzugt Pflanzen exprimiert 

40 werden. 

Eine Reihe von Produkten und Nebenprodukten natHrlich vor- 
•kommender Stof fwechselprozesse in Mikroorganismen, tierischen 
und pflanzlichen Zellen sind fur viele Industriezweige, ein- 
45 schliefilich der Futtermittel-, Nalirungsmittel-, Kosmetik- und 
pharmazeutischen Industrie, nlitzlich. Zu diesen gemeinsam als 
"Feinchemikalien" bezeichneten Molekiilen gehdren beispielsweise 
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Lipide und Fettsauren, iinter denen eine beispielhaf te Klasse 
die mehrfach ungesattigten FettsMuren sind. Fettsa\xren und Tri- 
glyceride haben eine Vielzahl von Anwendiingen in der Lebens- 
mittelindustrie, der Tierern^hrung, der Kosmetik imd im Pharma- 
5 bereich. Je nachdem ob es sich urn freie gesattigte oder imge- 
sattigte Fettsauren oder uia Triglyceride itiit einem erhohten 
Gehalt an gesattigten oder xmgesSttigten FettsSuren handelt, sind 
sie fiir die imterschiedlichsten Anwendungen geeignet, so warden 
beispielsweise mehrfach ungesattigte FettsSuren (polyunsaturated 
10 £atty acids, PUFAs) Babynahrung zur Erhdhxang des Kahrwertes 
zugesetzt. PUFAs haben weiterhin einen positiven Einfluss auf 
den Cholestarinspiegel im Blut von Menschen und eignen sich 
daher zum Schutz gegen Herzkrankheiten. So finden sie in ver- 
schiedenen diatischen Lebensmittsln oder Medikamenten Anwendung. 

15 

Besonders gseignete Mikroorganismen zur Herstellung von PUFAs 
sind Mikroorganismen wie Thraustochytrien oder Schizochytrien- 
StMmme, Algen wie Phaeodactylum tricornutiom oder Crypthecodinium- 
Arten, Ciliaten, wie Stylcnychia oder Colpidi™, Pilze, wie 

20 Mortierella, Entomophthora oder Mucor. Durch Stairanselekfcion 
ist eine Anzahl von Mutantenstammen der entsprechenden Mikro- 
orgauaismen entwickelt worden, die eine Reihe wtinschenswerter 
Verbindungen, einschliefilich PUFAs, produzieren. Die Selektion 
von Stammen mit verbesserter Produktion eines bestimmten Molekiils 

25 ist jedoch ein zeitraubendes und schwieriges Verfahren. 

Alternativ kann die Produktion von Feinchemikalien geeigneter- 
weise liber die Produktion von Pflanzen, die so entwickelt sind, 
dass sie die vorstehend genaimten PUFAs herstellen, im groSen 

30 MaSstab durchgefiihrt werden. Besonders gut ftir diesen Zweck 
geeignete Pflanzen sind Olfruchtpflanzen, die grofie Mengen an 
Lipidverbindungen enthalten wie Raps, Canola, Lein, Soja, Sonnen- 
blumen, Borretsch und Nachtkerze. Aber auch andere Nutzpflanzen, 
die 5le oder Lipide und Fettsauren enthalten, sind gut geeignet, 

35 wie in der eingehenden Beschreibung dieser Erfindung erwdhnt. 
Mitt els herkommlicher Ziichtung ist eine Reihe von Mutanten- 
pflanzen entwickelt worden, die ein Spektrxim an wtlnschenswerten 
Lipiden und Fettsaiiren, Cofaktoren und Bnzymen produzieren. 
Die Selektion neuer Pf lanzensorten mit verbesserter Produktion 

40 eines bestimmten Molektils ist jedoch ein zeitaufwandiges und 
schwieriges Verfahren oder sogar unmGglich, wenn die Verbindung 
in der entsprechenden 'Pflanze nicht nattirlich vorkommt, wie im 
Fall von mehrfach ungesattigten Cig-, C2o~Fsttsauren Mcid C22-Fett- 
sauren und solchen mit ISngeren Kohlenstof fketten. 
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Aufgrund der positiven Eigenschaf ten ungesattigter Fettsauren 
hat es in der Vergangenheit nicht an AnsS-tzen gefehlt, Gene, 
die an der Synthese von Fettsauren bzw, Triglyceriden beteiligt 
sind, fUr die Herstellung von Olen in verschiedenen Organismen 
5 mit geandertem Gehalt an iingesattigten Fettsauren verfiigbar 
2u machen. So wird in WO 91/13972 und seinem US-Aguivalent 
eine A-9-Desaturase beschrieben. In WO 93/11245 wird eine 
A-15-Desaturase in WO 94/11516 wird eine A-12-Desaturase bean- 
sprucht. A-6-Desaturasen warden in WO 93/06712, US 5,614,393; 

10 WO 96/21022 und WO 99/27111 beschrieben. Weitere Desaturasen 
werden beispielsweise in EP-A-0 550 162, WO 94/18337, 
WO 97/30582, WO 97/21340, WO 95/18222, EP-A-0 794 250, Stukey 
et al.; J. Biol. Chem. , 265, 1990: 20144-20149, Wada et al . , 
Nature 347, 1990: 200-203 Oder Huang et al.. Lipids 34, 1999: 

15 649-659 beschrieben. In WO 96/13591 wird eine A-6-Palmitoyl- 
ACP-Desaturase beschrieben und beansprucht. Die biochemische 
Charakterisierung der verschiedenen Desaturasen ist jedoch bis- 
her nur unzureichend erfolgt, da die Enzyme als membrangebundene 
Proteine nur sehr schwer zu isolieren und charakterisieren sind 

20 (McKeon et al.. Methods in Enzymol . 71, 1981: 12141-12147, 
Wang et al., Plant Physiol. Biochem., 26, 1988: 777-792). 

In He fen konnte sowohl eine Verschiebung des Fettsaurespektrums 
zu ungesattigten Fettsauren hin als auch eine Steigerung der 

25 Produktivitat nachgewiesen werden (siehe Huang et al., Lipids 34, 
1999: 649-659, Napier et al,, Biochem. J., Vol, 330, 1998: 
611-614) . Die Expression der verschiedenen Desaturasen in trans- 
genen Pflanzen zeigte allerdings nicht den gewiinschten Erfolg. 
Eine Verschiebung des FettsSurespektrum zu ungestttigten Fett- 

30 sS\iren hin konnte gezeigt werden, gleichzeitig zeigte sich aber, 
dass die Syntheseleistung der transgenen Pflanzen stark nachlieS, 
das heifit gegenuber den Ausgangspf lanzen konnten nur geringere 
Mengen an Olen isoliert werden. 

35 Weder in Hefen noch in Pflanzen werden natUrlicherweise mehr- 
fach ungesattigte C20- und/oder C22-Fettsauren mit mindestens 
zwei Doppelbindungen im Fettsauremoleklil wie ArachidonsSure 
(ARA) und/oder Eicosapentaensaure (EPA) und/oder Docosahexaen- 
saure (DHA) hergestellt. 

40 

Nach wie vor besteht daher bin groSer Bedarf sua neuen Genen, 
die f(ir Enzyme kodieren, die an der Biosyn these trngesSttigter 
Fettsauren beteiligt sind und es ermdglichen, diese in einem 
technischen Ma£stab herzustellen. Keines der bisher bekannten 
45 biotechnologischen Verfahren zur Herstellung von mehrfach 
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tingesattigten Fettsauren liefert die vorgenannten FettsSuren 
in wirtschaftlich nutzbaren Mengen. 

Bei der Expression von Genen in Pflanzen gibt es immer wieder 
5 Probleme; dass heilSt es koitimt durch die Expression nicht zur er- 
warteten Steigerung bei der Herstellmig des gewiinschten Wertpro- 
dukts . 

Verschiedene Methoden zum Einschleusen von Genen in das Genom von 
10 Pflanzen sind bekannt (Halford NG, Shewiry PR, Br. Med. Bull., 
2000; 56: 62-73). Ziel ist die Herstellving von Pflanzen mit vor- 
teilhaften, neuen Eigenscbaften, zum Beispiel zur Steigerung der 
landwirtschaft lichen Produktivitat , zur 'Qualitatssteigerung bei 
Nahrungsmitteln oder zur Produktion bestimititer Chemikalien oder 
IS Phaanaazeutika (Dunwell JM, J. Exp. Bot., 2000: 51 Spec No: 
487-96). 

Eine Grundvoraussetzung fur die transgene Expression bestiiniater 
Gene ist die Bereitstellung pf lanzenspezifischer Proitiotoren. Pro- 

20 motoren sind wichtige Werkzeuge in der Pf lanzenbiotechnologie, urn 
die Expression eines bestimmten Gens in einer transgenen Pflanze 
lokal und zeitlich zu steuern vnd so bestimmte Wesensmerkmale der 
Pflanze auszunutzen bzw* erst zu erzielen. Verschiedene Promote- 
ren ftir diverse Pf lanzenarten, bestirarate Pf lanzengewebe und Ent- 

25 wicklungsstadien sind bekannt. 

Verwendet werden zum Beispiel konstitutive Promotoren wie der 
Promoter der Nopal insynthase aus Agrobacteriuru, der TR-Doppelpro- 
motor Oder der Promoter des 35S~Transkriptes des Blumenkohlmo- 

30 saikvirus (CaMV) (Odell et al., Nature 1985: 313,810-812), der 
OQS (Octopin Synthase) Promoter aus Agrobacterium, der Ubiquitin 
Promoter (Holtorf S et al., Plant Mol . Biol. 1995, 29:637-646), 
die Promotoren der vakuolarer ATPase Untereinheiten oder der Pro- 
motor eines prolinreichen Proteins aus Weizen (WO 91/13991) . 

35 Nachteilig bei diesen Promotoren ist, dass sie in fast alien Ge- 
weben der Pflanze konstitutiv aktiv sind. Eine gezielte Expres- 
sion von Genen in bestimmten Pflanzenteilen oder zu bestimmten 
Entwicklungszeitpunkten ist mit diesen Promotoren nicht m6glich. 

40 Promotoren, deren Aktivitat gewebsspezifisch oder entwicklunsgab- 
hangig reguliert ist, wurden isoliert. Spezifitaten sind fur die 
Antheren, Ovarien, Bltlten, Blatter, Stengel, Wurzeln imd Samen 
beschrieben. Die Stringenz der Spezifitat, als auch die Expres- 
sionsaktivitat dieser Promotoren ist sehr xinterschiedlich. Zu 

45 nennen sind Promotoren, die eine blattspezif ische Expression ge- 
wahrleisten, wie der Promotor der cytosolischen FBPase avis Kar- 
toffel (WO 97/05900), der SSU Promotor (small subunit) der Rubi- 
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SCO (Ribulose-l,5-bisphosphatcarboxylase) oder der ST-LSI Promo- 
tor aus Kartoffel (Stockhaus et al., EMBO J. 8 (1989), 2445 - 
245) . 

5 Weitere Promotoren sind beispielsweise spezifische Promotoren fiir 
Knollen, Speichervmrzeln oder Wurzeln, wie beispielsv/eise der Pa- 
tatin Promotor Klasse I (B33), der Promotor des Cathepsin D Inhi- 
bitors aus Kartoffel, der Promotor der St&rke S3/nthase (GBSSl) 
oder der Sporamin Promotor, frucht spezifische Promotoren, wie 

10 beispielsweise der frucht spezifische Promotor aus Tomate (EP-A 
409625), fruchtreifungspezifische Promotoren, wie beispielsweise 
der fruchtreifungspezifische Promotor aus Tomate (WO 94/21794), 
bltitenspezifische Promotoren, wie beispielsweise der Phytoen-Syn- 
thase Promotor (WO 92/16635) oder der Promotor des P-rr Gens (WO 

15 98/22593) . 

Eine Variation der Aktivitat eines Promotoren anhangig vom Ent- 
wicklungs stadium der Pflanze wurd unter anderem von Baerson et 
al. beschrieiben (Baerson SR, Lamppa GK. Plant Mol Biol. 
20 1993;22(2) :255-67) . 

Samenspezifische Promotoren sind aufgrund der Bedeutung des Sa- 
mens als eine der Hauptnahrungs- bzw. Futterquellen von Mensch 
und Tier und als Produktionsort fur Wertstoffe von besonderen In- 

25 teresse. Bekannt sind Promotoren, die eine Expression in Samen 
und pflanz lichen Embryonen steuem. So wurden beispielsweise die 
Promotoren von Genen identifiziert, die ftir Speicherproteine ver- 
schiederier Dicotyledonen kodieren. Samenspezifische Promotoren 
sind zum Beispiel der Promotor des Pha'seolins (US 5504200, Bustos 

30 MM et al., Plant Cell. 1989; 1 (9) : 839-53) , des 2S Albumingens (Jo- 
seffson liG et al., J Biol Chem 1987, 262:12196-12201), des Legu- 
mins (Shirsat A et al . , Mol Gen Genet. 1989;215 (2) : 326-331) , des 
USP (unknown seed protein; Baumlein H et al.. Molecular & General 
Genetics 1991, 225 (3) :459-67) des Napin Gens ( Stalberg K, et 

35 al., L. Planta 1996, 199:515-519), des Saccharosebindeproteins 
(WO 00/26388} oder der LeB4-Promotor (Baumlein H et al., Mol Gen 
genet 1991, 225: 121-128). Diese steuem eine hohe samenspezifi- 
sche Expression von Speicherproteinen. 

40 Trotz der allgemeinen Annahme, dafi pflanz liche Promotoren von ei- 
ner Spezies auf die andere tJbertragbar sind und auch in artfrem- 
den Pflanzenspezies cLhnliche Aktivit^ten und Spezifitaten aufwei- 
sen, mehren sich Hinweise auf EinschrSnkungen von dieser Annahme. 
So zeigte es sich, dafi die Hdhe der transgenen Expression von he- 

45 terologen Genen unter Kontrolle dieser Promotoren, oft stark von 
der Art der Wirtspflahze aJohSngig ist. Es wurde f estgestellt, 
dass die Expression nicht iiraner absolut zelltypspezif isch ist. 
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Unterschiede im Expressionsmuster und der Expressionsstarke eines 
bestimmten Promotors k5nnen durch xinterschiedliche Wirtspflanzen 
Oder durch unterschledliche Insertionsorte in das Genom der 
Wirtspflanze bedingt sein (Goossens A et al.. Plant Phys 1999, 
5 120:1095-1104) . 

Durch eine Genexpression in anderen Pf lanzenteilen kann die Ver- 
wendung eines Promoters in einsr anderen Pflanzenart sehr einge- 
schrankt sein. Etwa wenn die Expression des Genes in den Metabo- 
10 lismus der Zelle, die Zusammensetzung der Membranlipide oder die 
Biosynthese eingreift. 

Es bestand daher die Aufgabe weitere Expressionskassetten fur die 
Expression in Pflanzen zur Verfagung zu stellen. Und diese fiir 

15 die Expression von Genen vorteilhaft Biosynthesegenen allein oder 
gegebenenf alls in Kombination mit anderen Enzymen in einem 
Verfahren beispielsweise zur Herstellung mehrfach ungesattigter 
FettsSuren zu verwenden. Diese Aufgabe wurde durch die erfin- 
dungsgemaiSen Expressionskassette mit einer Struktur ausgewMhlt 

20 aus der Gruppe gelost: 

a) LI - Promo tor - Strukturgen - L2, 

b) Ll - Promo tor - Strukturgen - L2 - Ll - Promotor - Struktur- 
25 gen - L2, 

c) LI - Promotor - Strukturgen - L2 - LI - Promotor - Stiruktur- 
gen - L2 - LI - Promotor - Strukturgen - L2, 

30 wobei LI, L2, Promotor und Strukturgen die folgende Bedeutung 
hat: 

LI = SEQ ID NO: 32 oder eine ^.cuivalente Restriktionsschnittstel- 
len enthaltende Sequenz, 

35 

L2 = unabhangig voneinander SEQ ID NO: 33, 34 oder 35 oder aqui- 
valente Restriktionsschnittstellen enthaltende Sequenzen, 

Promotor = pflanzlicher Promotor 

40 

Strukturgen = eine in Pflanzen exprimierbare 
Nukleinsauresequenz , 

Vorteilhaft ist das Strukturgen ein Biosynthesegen, boevorzugt 
45 ist es ein Biosynthesegen des Lipid- oder Fettsaurestof fwechsels, 
vorteilhaft ein pflanzliches Gen. In einer besonders vorteilhaf- 
ten Aus fvlhrungs form ist das Strukturgen eine Nukleinsauresequenz, 



wo 02/057464 



PCT/EP02/00461 



7 

die fur Proteins ausgewahlt aus der Gruppe : 
Acyl-CoA-Dehydrogenase(n) , Acyl-ACP[= acyl carrier protein] - 
Desatiirase(n) , Acyl-ACP-Thioesterase (n) , Fettsaure-Acyl-Transf 
rase(n), Fettsaure-Synthase(n) , Fettsaure-Hydroxylase{n) , Acetyl- 
5 Coenzym A-Carboxylase(n) , Acyl-Coenzym A-Oxidase (n) , Fettsaure- 
Desaturase (n) , Fettsaure-Acetylenasen, Lipoxygenase]!; Triacylgly- 
cerol-Lipasen , Allenoxid-Synthasen, Hydroperoxid-Lyasen oder 
Fettsaure-Elongase (n) , kodiert . 

10 Ganz besonders bevorzugt ist das Strukturgen eine Nukleinsaurese- 
cpienz ausgew^Mhlt aus der Gruppe: 

a) einer Nukleinsaureseguenz mit der in SEQ ID NO: 1, SEQ ID NO: 
3/ SEQ ID NO: 5 oder SEQ ID NO: 11 dargestellten Sequenz, 

15 

b) Nukleinsauresequenzen, die aufgrund des degenerierten genet i- 
schen Codes durch Ruckubersetz\ing der in SEQ ID NO: 2, 

SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten 
Aminosaureseciuenzen erhalten warden, 

20 

c) Derivate der in SEQ ID NO: 1, SEQ ID WO: 3, SEQ ID NO: 5 Oder 
SEQ ID NO: 11 dargestellten NukleinsSuresequenz , die flir Po- 
lypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 
oder SEQ ID NO: 12 dargestellten Aminos aureseguenzen codieren 

25 und mindestens 50 % Homologie auf Aminosaureebene aufweisen, 

ohne daS die enzymatische Wirkung der Polypeptide wesentlich 
reduziert ist. 

Unter einer aquivalente Restriktionsschnittstellen enthaltende 
30 Seqrienz im Sinne der Erfindung sind Sequenzen zu verstehen, die 

Restriktionsschnittstellen enthalten, die fiXr den Aufbau multip- 

ler Expressionskassetten geeignet sind, das heiSt geeigneter 

Weise nicht im Strukturgen vorhanden sind oder im binSren Vektor. 

Solche Restriktionsschnittstellen wie beispielhaft EcoRI, BamHI, 
35 Sad, PstI, Ncol, Ndel, Bgll, Bglll, Xhol, Xba und weitere sind 

dem Fachmann bekannt und konnen einschlagigen Fachbuchem entnom- 

men werden. 

Die erfindungsgemaSen Expressionskassetten konnen fur die Expres- 
40 sion von Genan in wirtschaf tlich wichtigen Kulturpf lanzen wis 
beispielsweise Lein, ftir die keine endogenen samenspezif ischen 
Promotoren bekannt waren, verwendet werden. Lein ist, wie die 
vorliegenden Arbeiten zeigten, fiir eine samenspezif ische Expres- 
sion von Genen besonders problematisch, da of f ensichtlich mehrere 
45 Promotoren, die vom Fachmann ftir samenspezif ische Expression in 
anderen Pfl€Ui2en routinemafiig benutzt werden, in z.B. in anderen 
Pf lanzen wie Lein nicht funktionieren, das heil^t nicht zu einer 



wo 02/057464 



PCT/EP02/00461 



8 

Transkription bzw. letztlich zu einer Expression der itiRNA des 
Strukturgens fiihrt. 

Verwendung der oben genannten erfindiingsgemaSen Expressionskas- 
5 setten in einem Verfahren zur Herstellung von Pettsaureestern mit 
einem erhohtem Gehalt an mehrfach ungesattigten Fettsauren mit 
mindestens zwei Doppelbindungen dad\irch gekennzeichnet , daS man 
mindestens eine Nukleinsd.ureseq;jenz ausgewSklt aus der Gmppe 

10 a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, 

SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 11 dargestellten 
Sequenz , 

b) Nukleinsauresequenz en, die aufgr\and des degenerierten 

15 genetisch.en Codes durch RUcktlbersetzung der in SEQ ID NO: 2, 
SEQ ID NO:. 4, SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten 
Aminos Suresequenzen erhalten werden, 

c) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 
20 oder SEQ ID NO: 11 dargestellten Nukleinsauresequenz , die 

fur Polypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, 
SEQ ID NO: 6 Oder SEQ ID NO: 12 dargestellten Aminosaure- 
secjuenzen codieren und mindestens 50 % Homologie auf Amino- 
saureebene aufweisen, ohne dass die enzymatische Wirkung 
25 der Polypeptide wesentlich reduziert ist, 

in einen Fettsaureester produzierenden Organismus einbringt, 
anzieht und die dem Organismus enthaltenden Fettsaureester iso- 
liert • 

Bei den im Verfahren verwendeten Nukleinsauresequenzen handelt es 
sich um isolierte Niikleinsauresequenzen, die fur Polypeptide mit 
A- 5-/ A- 6- Oder A-12-Desaturaseaktivitat codieren. j 

35 Im Verfahren werden vorteilhaft Fettsaureester mit mehrfach unge- 
stattigten Cis"; C20"" und/ oder C22~Fettsauremolekulen mit 
mindestens zwei Doppelbindungen im Fettsaureester hergestellt. 
Bevorzugt enthalten diese Fetts^uremolekCile drei, vier oder ftinf 
Doppelbindungen und fiihren vorteilhaft zur Synthese von Arachi- 

40 donsaxire (ARA) , Eicosapentaensaure (EPA) oder Docosahexaensaure 

(DHA) . i I 

• I 

Die Fettsaureester mit mehrfach ungesattigten Cig-/ C20- und/oder 
C22-Fettsauremolekulen konnen aus den Organismen, die ftir die Her- 
45 stellung der Fettsaureester verv/endet wurden, in Form eines 5ls 
Oder Lipids beispielsweise in Form von Verbindungen wie Sphingo- 
lipide, Phosphoglyceride, Lipide, Glycolipide, Phosphplipide , 
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Monoacylglyceride, Diacylglyceride, Triacylglyceride oder 
sonstige FettsSureester , die die mehrfach ungesattigten Fett- 
sauren mit luindestens zwei Doppelbindungen enthalteii/ isoliert 

. werden, 

5 

Als Organismus ftlr die Herstellung iin Verfahren kommen prinzipell 
alle prokaryontischen oder eurkaryontischen Organismen wie proka- 
ryontische oder eurkaryontische Mikroorgsuiismen wie gram-positive 
Oder gram-negative Bakterien, Pilze, Hefen, Algen, Ciliaten, tie- 

10 rische oder pflanzliche Zellen, Tiere oder Pflanzen wie Moose, 
zweikeimblattrige oder einkeimblattrige Pflanzen in Frage. Vor- 
teilhaft werden Organismen im erf indungsgemSSen Verfahren verwen- 
det, die zu den 6l-produzierenden Organismen gehoren, das heiEt 
die far die Herstellung von Olen verwendet werden, wie Mikroorga- 

15 nismen wie Crypthecodinium, Thraustochytriijm, Phaeodactylum und 
Mortierella, Entomophthora , Mucor, Crypthecodinium sowie andere 
Algen oder Pilze sowie Tiere oder Pflanzen, insbesondere Pflanzen 
bevorzugt Olfruchtpf lanzen, die grofee Mengen an Lipidverbindungen 
enthalten, wie Sojabohne, Erdnuss, Raps, Canola, Sonnenblume, 

20 Safflor, Nachtkerze, Lein, Soja, Borretsch, Baime (5lpalme, Ko- 
kosnuss) oder Feldfriichte, wie Mais, Weizen, Roggen, Hafer, 
Triticale, Reis, Gerste, Baumwolle, Maniok, Pfeffer, Tagetes, So- 
lanaceen-Pflanzen, wie Kartoffel, Tsibak, Aubergine iind Tomate, 
Vicia-Arten, Erbse, Alfalfa oder Buschpf lanzen (Kaffee, Kakao, 

25 Tee), Salix-Arten, Baiune (Olplame, KokosnuS) sowie ausdauernde 
Graser und Futterf eldf riichte . Besonders bevorzugte erfindungsge- 
maSe Pflanzen sind Olfruchtpf lanzen, wie Soja, Erdnufi, Raps, Ca- 
nola, Lein, Nachtkerze, Sonnenblume, Safflor oder Baurae (Olpalme, 
KokosnuS) . 

30 

Das Verfahren beinhaltet entweder die Zuchtung einss geeigneten 
transgenen Organismus bzw. transgenen Mikroorgcuiismus oder die 
Zuchtung von transgenen .Pf lanzenzellen, -geweben, -organen oder 
ganzen Pflanzen, umfassend die erf indungsgemaSen Nukleotidsequen- 

35 zen der SEQ ID NO: 1, 3,' 5 oder 11 gegebenenf alls in Verbindimgen 
mit den in SEQ ID NO: 7 und/oder SEQ ID NO: 9 dargestellten Se- 
quenzen allein oder in Kombination mit Sequenzen von vorteilhaf- 
ten erf indvingsgema&en Express ionskasset ten in vorteilhaf ten Vek- 
toren mit SEQ ID NO: .13-17 oder ihre Homologen, Derivate oder 

40 Analoga oder ein Genkonsfcrukt , das die SEQ ID NO: 1, 3, 5 oder 11 
ggf . in Verbind\ing mit §EQ ID NO: 7 und/oder 9 oder ihre Homolo- 
gen, Derivate oder Analoga umfasst, oder einen* Vektor, der diese 
Sequenz oder das Genkonstrukt umfasst, welches die Expression er- 
findungsgemal^r Nukleinsauremolekule herbeifiihrt, so dass eine 

45 Feinchemikalie produziert wird. Bei einer bevorzugten Ausftih- 
rungsform umfasst das Verfahren ferner den Schritt des Gewinnens 
einer Zelle, die eine solche erf indungsgemaEe Nukleinsaureseguen- 
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zen enthSlt, wobei eine Zelle mit einer Desaturasenukleins^iirese- 
quenz, einem Genkonstrukt oder einem Vektor, welche die 
Expression einer erfindungsgemSfien DesaturasenukleinsSiire allein 
Oder in Kombination herbeifUhren, transformiert wird. Bei einer 
5 weiteren bevcrzugten Ausftihrungsf orm umfasst dieses Verfahren 
femer den Schritt des Gewinnens der Feinchemikalie aus der 
Kultur. Bei einer besonders bevorzugten Ausftihrungsform gehSrt 
die Zelle zur Ordnung der Ciliaten, zu Mikroorganismen; wie 
Pilzen, ' Oder zuiti Pf lanzenreich, insbesondere zu Olfruchtpf lanzen, 
10 besonders bevorzugt sind Mikroorganismen oder Olfruchtpf lanzen 
beispielsweise Erdnuss, Raps, Canola, Lein, Soja, Saf flower 
(Distel) , Sonnenblumen oder Borretsch. 

Unter transgen im Sinne der Erfindung ist zu versfcehen, daS die 
15 im Verfahren verwendeten Nukleinsaviren oder die erfindungsgemafien 
Expressionskassetten nicht an ihrer naturlichen Stelle im Genom 
eines Organismus sind, dabei konnen die Nukleinsauren homolog 
Oder heterolog exprimiert werden. Transgen bedeutet aber auch, 
dass die Nukleinsauren oder Expressionskassetten an ihrem nattir- 
20 lichen Plat 2 im Genom eines Organisraus sind, dass jedoch die Se- 
quenz gegenuber der naturlichen Sequenz verandert wurde und/oder 
das die Regulationssequenzen, der naturlichen Sequenz en verSndert 
wurden. Bevorzugt ist unter transgen die Expression der erfin- 
dungsgemSSen Nukleinsauren an nicht nattirlicher Stelle im Genom 
25 zu verstehen, das heiSt eine homologe oder bevorzugt heterologe 
Expression der Nukleinsauren liegt vor. Bevorzugte transgene Or- 
gcuiismen sind die oben genannten transgenen Pf lanzen bevorzugt 
Olfruchtpf lanzen . 

30 Aus den im Verfahren hergestellten Fettsaureestem lassen sich 
die enthaltenden mehrfach ungesattigten Fettsturen beispielsweise 
liber eine Alkalibehandlung wie wassrige KOH oder NaOH vorteilhaft 
in Gegenwart eines Alkohols wie Methanol oder Ethanol freisetzen 
und isolieren Ober beispielsweise Phasentrennung und anschlieSen- 

35 der AnsSuerung tlber z.B. H2SO4. 

Die im Verfahren hergestellten Fettsaureester fallen in Form von 
Olen, Lipiden und/oder FettsSuren an, die mindestens zwei Doppel- 
bindungen in den Fettsauremolekulen bevorzugt drei, vier, fiinf 

40 oder sechs Doppelbindungen enthalten. Auch sind Zusaitonensetzun- 
gen, die die genannten Ol-/ Lipid- und/oder Fettsauren enthalten, 
sowie die Veirwendumg der 6le, Lipide und/oder Fettsauren oder der 
Zusammensetzungen in Futter, Nahrungsmitteln, Kosmetika oder 
Pharmazeutika ein weiterer Anwendungsmoglichkeit der vorgenannten 

45 Stoffe. 
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Ein weiterer Aspekt betrifft ein Verfahren zur Modulation der 
Produktion eines Molekuls durch einen Mikroorganismus . Diese Ver- 
fahren umfassen das Zusammenbringen der Zelle mit einer Svhstanz, 
welche die erfindungsgemaSen Desaturaseaktivitat allein Oder in 
5 Kombination oder die Desaliurasenukleinsaureexpression moduliert, 
so dass eine zellassoziierte Aktivitat relativ zu der gleichen 
Aktivitat in Abwesenheit der Substanz verandert wird. Bei einer 
bevorzugten Ausfuhrungsform wird/werden ein oder zwei Stoffwech- 
selweg{e) der Zelle ftir Lipide und Fettsauren, Cofaktoren und En- 

10 zyme moduliert oder der Transport von Verbindtmgen iiber diese 
Membranen moduliert, so dass die Ausbeute oder die Rate der 
Produktion einer gewunschten Feinchemikalie durch diesen Mikro- 
organismus verbessert ist. Die Substanz, welche die Desaturase- 
aktivitat moduliert, kann eine Substanz sein, welche die 

15 Desaturaseaktivitat oder Desaturasenukleinsaureexpression 

stiinuliert oder die als Zwischenprodukt bei der Fettsaurebio- 
synthese verwendet werden kann. Beispiele fiir Substanz en, welche 
die Desaturaseaktivitat oder DesaturasenukleinsSureexpression 
stimulieren, sind u.a. kleine Molekiile/ aktive Desaturasen sowie 

20 desaturasenkodierende NukleinsSuren, die in die Zelle eingebracht 
worden sind. Beispiele fur Substanzen, welche die Desaturase- 
aktivitat Oder -Expression hemmen, sind u.a. kleine MolektLle 
und Antisense- Desaturasenukleinsauremolekule. 

25 Ein weiterer Aspekt betrifft ein Verfahren zur Modulation der 

Ausbeuten einer gew(inschten Verbindung aus einer Zelle, umfassend 
das Einbringen eines Wildtyp- oder Mutanten-Desaturasegens, das 
entweder auf einem separaten Plasinid gehalten oder in das Genom 
der Wirtszelle integriert wird, in eine Zelle. Bei Integration in 

30 das Genom kann die Integration zufallsgema£ sein oder durch der- 
artige Rekombination erfolgen, dass das native Gen durch die ein- 
gebrachte Kopie ersetzt wird, wodurch die Produktion der ge- 
wiinschten Verbindung durch die Zelle moduliert wird, oder durch 
Verwendung eines Gens in trans, so dass das Gen mit einer funk- 

35 tionellen Expressionseinheit, welche mindestens eine die Expres- 
sion eines Gens gewahrleis tends Sequenz und mindestens eine die 
Polyadenylierung eines funktionell transkribierten Gens gewahr- 
leistende Sequenz enthait, funktionell verbunden 1st. 

40 Bei einer bevorzugten Form des Verfahrens sind die Ausbeuten 
modifiziert, Bei einer weiteren bevorzugten Aus ftlhr\ings form 
wird die gewOnschte Chemikalie vermehrt, wobei unerwtinschte 
storende Verbindtmgen vermindert werden kcSnnen. Bei einer 
besonders bevorzugten Aus filhrungs form ist die gewtinschte Fein- 

45 chemikalie ein Lipid oder eine Fettsaure, ein Cofaktor oder ein 
Enzym. Bei besonders bevorzugten Aus fiihmings form ist diese 
Chemikalie eine mehrfach ungesattigte Fettsaure. Starker bevor- 
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zugt ist sie ausgewahlt aus Arachidonsaure (ARA) , Eicosapentaen- 
saure (EPA) oder DocosahexaensSure (DHA) . 

Die vorliegende Erfindiing stellt vorteilhafte Multiexpressions- 
5 kassetten und Konstrukte zur multiparallelen samenspezif ischen 
Expression von Genkombinationen in Pflanzen zur Verfiigung. 

Diese konnen im oben beschriebenen Verfahren zur Expression von 
Genen, bevorzugt den in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, 
10 SEQ ID NO: 7, SEQ ID NO: 9 odbr SEQ ID NO: 11 beschriebenen, in 
Algen und Pilzen und Pflanzen, insbesondere Slfruchtpflanzen sind 
bevorzugte Organismen fiir das Verfahren verwendet werden. 

Durch die Verwendung der erf indungsgeitiSSen Bxpressionskassetten 

15 konnen im Verfahren in Verbindung mit den oben genannten Nuklein- 
sauremolekaie zur gentechnologisch Veranderung von Pflanzen ver- 
wendet werden, so dass sie schlieSlich zur Herstellung von besse- 
ren oder ef fizienteren Produzenten einer oder mehrerer Feinchemi- 
kalien fiihren. Diese verbesserte Produktion oder Effizienz der 

20 Produktion einer Feinchemikalie kann durch eine direkte Wirkung 
der Manipulation eines erf indungsgemafien Gens oder durch eine in- 
direkte Wirk\ing dieser Manipulation hervorgerufen werden. Unter 
Feinchemikalien sind im Sinne der Erfindung beispielsweise Fett- 
sSureester, die mehrfach ungesattigte Fettsauren mit mindestens 

25 zwei Doppelbindungen en thai ten wie Sphingolipide, Phosphoglyce- 
ride, Lipide, Glycolipide/ Phospholipide, Monoacylglycer ide , Dia- 
cylglyceride, Triacylglyceride oder sonstige Fettsaureester , die 
die mehrfach ungesattigten Fettsauren mit mindestens zwei Doppel- 
bindungen enthalten, zu verstehen. Weiter sind darunter zu ver- 

30 stehen Verbindungen wie Vitamine beispielsweise Vitamin E, Vita- 
min C; Vitamin B2, Vitamin B6, Pantolacton, Carotinoide wie Asta- 
xanthin, P-Carotin, Zeaxanthin und andere. 

Moose und Algen sind die einzigen bekannten Pf lanzensysteme, 
35 die erhebliche Mengen an mehrfach ungesattigten Fettsauren, wie 
Arachidonsaure (ARA) und/ oder Eicosapentaensaure (EPA) und/ oder 
DocosahexaensS.ure (DHA) herstellen. Moose enthalten PUFAs in 
Membranlipiden wShrend Algen, algenvean^randte Organismen und 
einige Pilze auch nennenswerte Mengen an PUFAs in der Triacyl- 
40 glycerolfraktion akkumulieren. Daher eignen sich Nukleinsaure- 
molekUle, die aus solchen StSmmen isoliert werden, die PUFAs auch 
in der Triacylglycerolfraktion akkumulieren, besonders vorteil- 
haft zur Modifikation des Lipid- und PUFA-Produkt ions systems in 
einem Wirt, insbesondere in Mikroorganismen, wie den vorstehend 
45 erwShnten Mikroorganismen, und Pflanzen, wie Olfruchtpf lanzen, 
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beispielsweise Raps, Canola, Lein, Soja, Sonneiiblumen ; Borretsch. 
Sie sind deshalb vorteilhaft im Verfahren verwendbar. 

Die im Verfahren unter Verwendung der erf indungsgeitiaSen Expres- 
5 sionskassetten verwendeten NukleinsMuresequenzen codieren fur 
Desaturasen, die zur Produktion langkettiger mehrfach unge- 
sattigter Fettsauren, vorzugsweise mit mehr als sechzehn, 
achtzehn oder zwanzig Kohlenstoffatoinen im Kohlenstof fgrundger'iist 
der Fettsaure und/oder mindestens zwei Doppelbindungen in der 

10 Kohl ens toffkette, geeignet sind, wobei eine NukleinsSure fiir ein 
Enzym codiert, das Doppelbindungen in die A-5-Position, in einem 
anderen Fall in die A-6-Position und in einem weiteren Fall in 
die A-12-Position einfiiliren kann. Mithilfe dieser Nukleinsauren 
konnen hohe Mengen an PUFAs in der Triacylgycerolfraktion erhal- 

15 ten werden. Weiterhin warden weitere Desaturasen isoliert, die 
allein oder zusainmen mit einer A-4-Desaturase fur ein Verfahren 
zur Produktion polyungesattigter Fettsauren genutzt werden kon- 
nen. Dabei ist in der Anmeldung unter-dem Singular d.h. unter ei- 
nem Desaturasegen oder -Protein auch der Plural d.h, die Desatu- 

20 rasegenen oder -Proteinen zu verstehen. 

Die Herstellung einer Triensaure mit Cis-Kohlenstof fkette mit- 
hilfe von Desaturasen konnte bisher gezeigt werden. In diesen 
literaturbekannten Verfahren vnirde die Herstellung von y-Linolen- 
25 saure beansp2rucht . Bisher konnte jedoch niemand die Herstellung 
sehr langkettiger mehrfach ungesattigter Fetts§uren (mit C20- und 
langerer Kohlenstof fkette sowie von Triensauren und hoher unge- 
sattigten Typen) allein dxirch modifizierte Organismen zeigen. 

30 Zur Herstellung der erfindungsgonnSSen langkettiger PUFAs miissen 
die mehrfach ungesattigten Cis-Fettsauren zunachst durch die 
enzymatische Aktivitat einer Elongase urn mindestens zwei Kohlen- 
stof fatome verlangert werden. Nach einer Elongationsrunde fUhrt 
diese Enzyioaktivitat zu C2o-Fettsauren, und nach zwei, drei und 

35 vier Elongationsrunden zu C22-/ C24- oder C2 6 "-Fettsauren. Die in 
dieser Erfind\ing of fenbarten NukleinsSuresequenzen, die fur ver- 
schiedene Desaturasen codieren, kSnnen im Konzert mit Elongasen 
zu sehr langkettigen, polyungesattigten fiihren. Die Aktivitat 
der erfindungsgemafien Desaturasen fiihrt vorzugsweise zu Cis-i C20- 

40 \md/oder C22"F®ttsauren mit mindestens zwei Doppelbindungen im 
FettsSLuremolekQl, vorzugsweise mit drei, vier, ftinf oder sechs 
Doppelbindtingen, besonders bevorzugt zu Cis- und/oder C20'-Fett- 
sauren mit mindestens zwei Doppelbindungen im Fettsauremolekiil, 
vorzugsweise mit drei, vier oder fiinf Doppelbindomgen im Molekiil. 

45 Die Fettsclureelongation kann durch Kombination der erfindungsge- 
mcLfien Desaturasen mit einer Elongaseaktivitat erfolgen, wobei die 
durch die in SEQ ID NO: 9 codierte Elongase vorteilhaft verwendet 
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werden kann. Nachdem die Verlangerung mit dem erf indungsgeiaaSen 
Enzym(en) stattgefunden hat, k^nnen weitere Desaturierungs- 
schritte wie z.B, eine solche in A-5-Position erfolgen. Auch die 
Kombination mit anderen Elongasen wie solche, die zu einer Ver- 
5 langening von C^a- auf C2o~ oder von C2o~ auf C22-2a Ketten wie in 
WO0012720 of fenbart fiihrt, kann Verwendung finden imd/oder einer 
Desaturase mit Aktivitat fiir A-4-Position kann vorteilhaft ein- 
gesetzt werden, um die hoch desaturierten Fettsauren zu erhalten. 
Daher fiihren die Produkte der DesaturaseaktivitSten und der 

10 m5glichen weiteren Desaturierxing zu bevorzugten PUFAs mit einem 
hdheren Desaturierungsgrad, wie Dihomo-gamma-Lonol ens Sure, 
DocosadiensS.nre, Arachidonsaure, C06-Eicosatriendihonio-Y-linolen- 
saure, Eicosapentaensaure, a)3-Eicosatriensaure, coS-Eicosatetraen-- 
sSure, Docosapentaensaure oder Docoeahexaensaure. Substrate der 

15 erf indungsgeiticUSen Enzymaktivitat sind zum Beispiel TaxolsSure; 

6, 9-Octadecadiensaure, LinolsSure, PinolensSure, a-oder y-Linolen- 
sSure oder Stearidonsaure sowie Arachidonsaure, Eicosatetraen- 
sS-ure, Docosapentaensaure, EicosapentaensSure . Bevorzugte Sub- 
strate sind Linolsaure, y-LinolensSure und/ oder a-Linolens.Sure 

20 sowie Arachidonsaure, Eicosatetraensaure , Docosapentaensaure, 
Eicosapentaensaure, Besonders bevorzugt als Produkte des 
erf indungsgemaHen Verfahrens sind Arachidonsaure, Docosapentaen- 
saure, Eicosapentaensaure. Die Cia-Fettsauren mit iTiindestens zwei 
Doppelbindungen in der Fettsaure konnen durch die erfindungs- 

25 gema£e enzyniatische Aktivitat in Foria der freien Fettsaure oder 
in Form der Ester, wie Phospholipide, Glycolipide, Sphingolipide, 
Phosphoglyceride, Monoacylglyceride , Diacylglyceride oder Tri- 
acylglyceride, verlangert werden. 

30 Fiir die menschliche Emahrung ist konjugierte Linolsaure "CLA" 
von besonderer Bedeutung. Unter CLA versteht man insbesondere 
Fettsauren wie C18:2 ^ cis, utrans oder das Isomer C18:2 lotrans, 12 cis^ 
die aufgrund menschlicher Enzymsysteme nach Aufnahme im KOrper 
desaturiert bzw. elongiert werden kSnnen und zu gesundheits- 

35 fordernden Effekten beitragen k6nnen. Mit den erf indtingsgemaSen 
Desaturasen (A- 12 -Desaturase) konnen auch solche konjugierten 
Fettsauren mit wenigstens zwei Doppelbindungen im Molekul 
desaturiert werden und daiait solche gesundheitsf ordemden 
Fettsauren der menschlichen Ernahrung zugeftihrt werden. Weitere 

40 Beispiel fiir konjugierte Fettsauren sind alpha -Parinsirsaure, 
Punicasaure, Eleostearinsaure und Calendulasaure. 

Unter der Verwendung von der erf indungsgemaSen Expressionkasset- 
ten in Klonierungsvektoren in Pflanzen und bei der Pf lanzentrans- 
45 formation, wie denjenigen, die verdf fentlicht sind in und dort 
zitiert sind: Plant Molecular Biology and Biotechnology (CRC 
Press, Boca Raton, Florida), Kapitel 6/7, S. 71-119 (1993); F.F. 
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White, Vectors for Gene Transfer in Higher Plants; in; Transgenic 
Plants, Bd. 1, Engineering and Utilization, Hrsgb. : Rung und R. 
WUy Academic PresS/ 1993, 15-38; B, Jenes et al., Techniques for 
Gene Transfer, in: Transgenic Plants, Bd, 1, Engineering and Uti- 
5 lization, Hrsgb.: Kung und R. Wu, Academe Press (1993), 128-143; 
Potrykus, Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991), 
205-225)), lassen sich Gene vorteilhaft Biosynthesegene ^frLe 
die oben beschriebenen Nukleinsauren 2ur genteclinologischen Ver- 
Snderung eines breiten Spektruius an Pflanzen verwenden, so dass 

10 diese ein besserer oder ef f izienterer Produzent beispielsweise 
eines oder mehrerer von Lipiden hergeleiteter Produkte/ wie PU- 
FAs, warden. Diese verbesserte Produktion oder Effizienz der Pro- 
duktion eines beispielsweise von Lipiden hergeleiteten Produktes, 
wie PUFAs, kann durch direkte Wirkung der Manipulation oder eine 

15 indirekte Wirkung dieser Manipulation hervorgeruf en werden. 

Es gibt eine Reihe von Mechanismen, durch die die Veranderimg 
eines erf indvuigsgemaEen Desaturaseproteins die Ausbeute, 
Produktion und/ oder Effizienz der Produktion einer Fein-- 

20 chemikalie aus einer Olfruchtpflanze oder eineiti Mikrcorganisitius 
aufgrund eines veranderten Proteins direkt beeinflussen kann. 
Die Anzahl oder Aktivitat des Desaturaseproteins oder -Gens 
sowie von Genkombinationen von Desaturasen und Elongasen kann 
erhoht sein, so dass groSere Mengen dieser Verbindungen de 

25 novo hergestellt werden, well den Organismen diese Aktivitat 
und F^igkeit zur Biosynthese vor dem Einbringen des ent- 
sprechenden Gens fehlte. Entsprechendes gilt fto die Kombination 
Hiit weiteren Desaturasen oder Elongasen oder weiteren Enzymen 
aus dem Lipids toffwechsel, Auch die Verwendung verschiedener 

30 divergenter, d.h. au£ DNA-Sequenzebene unterschiedllcher 
Seauenzen kann dabei vorteilhaft sein bzw. die Verwendung 
von Promotoren zur Genexpression, die eine andere zeitliche 
Genexpression z.B. abhangig vom Reifegrad eines Samens oder 
6l-speichernden Gewebes ermfiglicht. 

35 

Durch das Einbringen eines Desaturasegens oder mehrerer Desatura- 
segene unter Kontrolle der erf indungsgemafien Expressionskassetten 
in einen Organismus all ein oder in Kombination mit anderen Genen 
in eine Zelle kann nicht nur den Biosynthesef luss zuki Endprodukt 

40 erhoht, sondern auch die entsprechende Zusammeneetzung der Enpro- 
dukte beispielsweise der Triacylglycerine erhdht oder de novo ge- 
schaffen werden. Hbenso kann die Anzahl oder AktivitMt anderer 
Gene, die am Import von Nahrstoffen, die zur Biosynthese einer 
Oder mehrerer Feinchemikalien (z.B. Fettsauren, polaren und neu- 

45 tralen Lipiden) notig sind, erh6ht sein, so dass die Konzentra- 
tion dieser Vorlaufer, Cofaktoren oder Zwischenverbindungen in- 
nerhalb der Zellen oder innerhalb des speicherkompartiments er- 
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hoht ist, wodurch die FShigkeit der Zellen zur Produktion von PU- 
FAs, wie im folgenden beschrieben, weiter gesteigert wird. Fett- 
s^uren und Lipide slnd selbst als Feinchemikalien wUnschenswert; 
durch Optimierung der Aktivitat oder ErhShung der Anzahl einer 
5 Oder mehrerer Desaturasen, die an der Biosynthese dieser Verbin- 
dungen beteiligt sind, oder durch Zerstoren der Aktivitat einer 
Oder mehrerer Desaturasen, die am Abbau dieser Verbindungen be- 
teiligt sind, kann es mOglich sein, die Ausbeute, Produktion und/ 
Oder Ef fizienz der Produktion von Fettsaure- und Lipidmolekulen 
10 aus Pflanzen oder Mikroorganismen zu steigeru. 

Die Mutagenese der/des erf indungsgemSfien Desaturasegene ( s) kann 
weiterhin zu einem Desaturaseprotein mit geanderten Aktivitaten 
fiihren, welche die Produktion einer oder mehrerer gewUnschter 

15 Feinchemikalien direkt oder indirekt beeinf lussen. Beispiels- 
weise kann die Anzahl oder Aktivitat der/des erf indTangsgGitiSSen 
Desatxirasegens (e) gesteigert werden, so dass die normalen Stoff- 
wechselabfaile oder -nebenprodukte der Zelle (deren Menge m5g- 
licherweise aufgrund der Uberproduktion der gewiinschten Fein- 

20 chemikalie erhoht ist) effizient exportiert werden, bevor sie 
andere Molekiile oder Prozesse innerhalb der Zelle (welche die 
LebensfShigkeit der Zelle senken wirdeii) zerstdren oder die Bio- 
synthesewege der Feinchemikalie st6ren wUrden (wodurch die Aus- 
beute, Prodiiktion oder Ef fizienz der Produktion der gewiinschten 

25 Feinchemikalie verringert wird) . Femer konnen die relativ groEen 
intrazellularen Mengen der gewttnschten Feinchemikalie selbst 
toxisch fUr die Zelle sein oder Snzym-Riickkopplungsmechajiismen, 
wie die allosterische Regulation, storen, beispielsweise konnte 
sie durch Steigerung der Aktivitat oder Anzahl anderer strom- 

30 abwarts folgender Enzyme oder Entgiftungsenzyme des PUFA-Wegs 

die Allokation der PUFA in die Triacylgylcerin-Fraktion steigern, 
man konnte die Lebensf ahigkeit von Saatzellen erhohen, was 
wiederum zu besserer Entwicklung von Zellen in Kultur oder zu 
Saaten ftihrt, die die gewiinschte Feinchemikalie produzieren. 

35 Das erf indungsgemaiSe Desaturasegen kann auch so manipuliert 

werden, dass die entsprechenden Mengen der verschiedenen Lipid- 
und FettsSuremolelcfile hergestellt werden. Dies kann eine ein- 
schneidende Wirkung auf die Lipidzusaramensetzung der Membran 
der Zelle haben und erzeugt neue Ole zusatzlich sum Auftreten 

40 neusynthetisierter PUFASi Da jeder Lipidtyp unterschiedliche 
physikalische Elgenschaften hat, kann eine Ver&idenmg der 
Lipidzusammensetzimg einer Membran die MembranfluiditSLt erheb- 
lich verandern. Andeningen der Membranf luiditat konnen sich 
auf den Transport von Molektilen iiber die Membran sowie auf die 

45 Unversehrtheit der Zelle auswirken, die beide eine entscheidende 
Wirkxmg auf die Produktion von Feinchemikalien besitzen. In 
Pflanzen k5nnen diese linderungen \iberdies auch andere Merk- 
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male, wie Toleranz gegeniiber abiotischen und biotischen Stress* 
situationen, beeinf lussen. 

Im Verfahren konnen isolierte Nukleinsauremolekiile (z.B. cDNAs) , 
5 umfassend Nukleotidsequenzen, die sine Desaturase oder mehrere 
Desaturasen oder biologisch aktive Teile davon codieren, oder Nu- 
kleinsaurefragiaente, die sich als Primer oder Hybridisierungs son- 
den zum Nachweis oder zur Amplif ikation desaturasekodierender 
Nukleinsauren (z.B. UNA oder mRNA) eignen, verwendet werden. Bei 

10 besonders bevorzugten Ausfuhrungsf ormen uimfasst das NukleinsSure- 
molekttl eine der in Sequenz ID N0:1 bzw 3 und 5 dargestellten Nu- 
kleotidsequenzen oder die kodierende Region oder ein Komplement 
einer dieser Nukleotidsequenzen. Bei anderen besonders bevorzug- 
ten Ausfuhrungsf ormen umfasst das isolierte Nukleinsaurerablekul 

15 eine Nukleotidsequenz, die an eine Nukleotidsecjuenz , wie in der 
Sequenz SEQ ID NO: 1, 3, 5 oder 11 dargestellt; oder einen Teil 
davon hybridisiert oder zu mindestens etwa 50 %, vorzugsweise 
mindestens etwa 60 %, starker bevorzugt mindestens etwa 70 %, 
80 % Oder 90 % und noch starker bevorzugt mindestens etwa 95 %, 

20 96 97 %, 98 %, 99 % oder mehr homolog dazu ist. Bei anderen 
bevorzugten Ausfiihrungsf ormen kodiert das isolierte Nukleinsaure- 
molektil eine der in der Sequenz SEQ ID NO: 2, 4, 6 oder 12 darge- 
stellten AminosSuresequenzen. Das bevorzugte Desaturasegen be- 
sitzt vorzugsweise auch mindestens eine der hier beschriebenen 

25 Desaturaseaktivitaten. 

Bei einer weiteren Ausf uhrungsf orm kodiert das isolierte 
Nukleinsauremolektil ein Protein oder einen Teil davon, wobei 
das Protein oder der Teil davon eine Aminosauresequenz enthalt/ 

30 die ausreichend homolog zu einer Aminosauresequenz der Sequenz 
SEQ ID NO: 2, 4, 6 Oder 12 ist, dass das Protein oder der Teil 
davon eine Desaturaseaktivit§.t beibehSlt. Vorzugsweise behalt das 
Protein oder der Teil davon, das /der von dem Nukleinsauremolekiil 
kodiert wird/ die Fahigkeit, an Stoffwechsel von zum Aufbau 

35 von Zellmembranen von Pf lanzen notwendigen Verbindungen oder 
am Transport von Molekiilen iiber diese Membranen teilzunehmen. 
Bei einer Ausfuhrungsfoina ist das von dem Nukleinsauremolekiil 
kodierte Protein zu mindestens etwa 50 %, vorzugsweise mindestens 
etwa 60 % und starker bevorzugt mindestens etwa 70 %; 80 % oder 

40 90 % und am starksten bevorzugt mindestens etwa 95 %, 96 %, 97 %, 
98 %, 99 % oder mehr homolog zu einer Aminosauresequenz der 
Sequenz SEQ ID NO: 2, 4, 6 oder 12. Bei einer weiteren bevor- 
zugten Ausf-Qhrungsf orm ist das Protein ein VolllSngen-Protein, 
das im wesentlichen in Teilen homolog zu einer gesamten Amino- 

45 sauresequenz der SEQ ID NO: 2, 4, 6 oder 12 (die von dem in 
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SEQ ID NO: 1, 3, 5 oder 11 gezeigten offenen Leserahmen herrtihrt) 
ist. 

Bei anderen Ausf(ihnmgsf ormen umfasst die isolierte Desaturase 
• 5 eine Aminosauresequenz, die zu mindestens etwa 50 % homolog zu 
einer der AminosSureseqiiGnzen der SEQ ID NO: 2, 4, 6 oder 12 ist 
und am Stof fwechsel von zum Aufbau von FettsSuren in einem Mikro- 
organismus oder einer Pflanzenzelle notwendigen Verbindungen oder 
am Transport von Molekulen liber diese Membranen teilnehmen kann, 
10 wobei desaturierte Cis- oder C20-22-Kohlenstof fketten mit Doppel- 
bindungen an mindestens zwei Stellen gemeint ist. 

Bei einer anderen bevorzugten Ausftihrungsf orm rtihrt das isolierte 
Nukleinsauremolekiil von Phaeodactylum tricornutum UTEX646 her 
.15 und kodiert ein Protein {z.B. ein Desaturasefusionsprotein) , 

das eine biologisch aktive Domane entMlt, die zu mindestens etwa . 
50 % Oder mehr homolog zu einer Aminosauresequenz der Sequenz 
SEQ ID NR 2, 4, 6 oder 12 ist und die Fahigkeit, am Stof fwechsel 
von zum Aufbau von Zellmembranen von Pf lanzen notwendigen Ver- 

20 bindungen oder am Transport von Molekulen iiber diese Membranen 
teilzunehmeni beibehSlt oder zumindest eine der Desaturierungs- 
aktivitaten resul tier end in PUFAs wie GLA, ALA, Dihomo-gamma 
Linolensaurei ARA, EPA oder DHA Oder deren Vorlauf ermolekaie 
besitzt, und umfasst auch heterologe Nukleins^uresequenzen, die 

25 ein heterologes Polypeptid oder regulatorische Proteine kodieren. 

Alternativ kann die isolierte Desaturase eine Aminosaiiresequenz 
umfassen, die von einer Nukleotidsequenz kodiert wird, die an 
eine Nukleotidseqiaenz der SEQ ID NO: 1, 3, 5 oder 11 hybridi- 

30 siert, z.B. lonter stringenten Bedingungen hybridisiert , oder zu 
mindestens etwa 50 %, vorzugsweise mindestens etwa 60 %, starker 
bevorzugt mindestens etwa 70 %, 80 % oder 90 % und noch starker 
bevorzugt mindestens etwa 95 %, 96 %, 97 %, 98 99 % oder mehr 
homolog dazu ist. Es ist ebenfalls bevorzugt, dass die bevor- 

35 zugten Desaturasef ormen ebenfalls eine der hier beschriebenen 
Desaturaseaktivitaten besitzen. 

Bei einer sinderen Ausftlhrungsform ist das isolierte NukleinsSxire- 
molekai mindestens 15, 25, 50, 100, 250 oder mehr Nukleotide lang 

40 und hybridisiert unter stringenten Bedingungen an ein Nuklein- 
sauremolekul / das eine Nukleotidsequenz der SEQ ID NO: 1/ 3, 5 
Oder 17 umfasst. Vorzugsweise entspricht das isolierte Nuklein- 
sauremolektU einem nattirlich vorkornmenden NukleinsSuremolekai . 
Starker bevorzugt kodiert das isolierte Nukleinsauremolekul 

45 natiirlich vorkommende Phaeodactylum-Desaturase oder einen 
biologisch aktiven Teil davon. 
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Eine weitere Ausf uhxungsform der Erfindung sind Express ions- 
kassetten, die die Expression der erf indungsgeiciaSerx NukleinsSuren 
mit den Seguenzen SEQ ID NO: 1, 3, 5 oder 11 in den verschiedenen 
Organismen wie pf lanzliche Zellen, Geweben, Teilen von Pflanzen 
5 Oder ganzen Pflanzen entioglichen. 

Unter der erf indimgsgemaSen Express ionskassette (= Nukleinsaure- 
konstrukt oder -fragment) sind die in SEQ ID NO: 32 als LI und 
einem Promoter, einem Strukturgen ausgewahlt aus den vorteilhaf- 

10 ten Sequenzen SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder 
SEQ ID NO: 11, die sich als Ergebnis des genetischen Codes und/ 
Oder deren funktionellen oder nicht funktionellen Derivate zu 
verstehen, \md die Polylinder-Terminator-Polylinker-Seguenzen ( = 
L2) SEQ ID NO: 33, SEQ ID NO: 34 oder SEQ ID NO: 35 zu verstehen. 

15 Diese steuern vorteilhaf terweise die Genexpression in der Wirts- 
zelle, Diese in den Konstrukten enthaltenen regulatorischen Se- 
quenzen sollen die gezielte Expression der Gene und der Protei- 
nexpression ermoglichen , Dies kann beispielsweise je nach Wirts- 
organisicnis bedeuten, dass das Gen erst nach Induktion exprimiert 

20 und/oder iiberexprimiert wird, oder dass es sofort exprimiert und/ 
Oder iiberexprimiert wird. Beispielsweise handelt es sich bei die- 
sen regulatorischen Sequenzen um Sequenzen an die Induktoren oder 
Repressoren binden und so die Expression der NukleinsSure regu- 
lieren. Zusatzlich zu diesen neuen Regulationsseguenzen oder an- 

25 stelle dieser Sequenzen kann die nattirliche Regulation dieser Se- 
quenzen vor den eigentlichen Strukturgenen noch vorhanden sein 
und gegebenehfalls genetisch verSndert worden sein, so dass die 
natiirliche Regulation ausgeschaltet lond die Expression der Gene 
erhoht wurde. Das Genkonstrukt kann aber auch einfacher aufgebaut 

30 sein, das heiSt es wurden keine zusStzlichen Regulationssignale 
vor die NukleinsSuresequenz oder dessen Derivate inseriert und 
der nattirliche Promotor mit seiner Regulation wurde nicht ent- 
fernt. Stattdessen wurde die natiirliche Regulationssequenz so luu- 
tiert, dass keine Regulation mehr erfolgt und/oder die Genexpres- 

35 sion gesteigert wird. Diese veranderten Promotoren konnen in Form 
von Tei I sequenzen (= Promotor mit Teilen der erf indungsgemafien 
Nukleinsauresequenzen) auch allein vor das natiirliche Gen zur 
Steigerxmg der Aktivitat gebracht werden. Das Genkonstrukt kann 
aulSerdem vorteilhaf tejnveise auch eine oder mehrere sogenannte 

40 ''enhancer Secjuenzen" funktionell verkniipft mit dem Promotor ent- 
halten, die eine erhohte Expression der Nukleinsauresequenz er- 
mSglichen. Auch am 3'-Ende der DNA-Sequenzen kSnnen zusStzliche 
vorteilhafte Sequenzen inseriert werden wie weitere regulatori- 
sche Elemente oder Terminatoren . Die A-5-Desaturase-/A-6-Desatu- 

45 rase und/oder A-12-Desaturasegene konnen in einer oder mehreren 
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Kopien in der Expressionskassette (= Genkonstrukt) enthalten 
sein. 

Die regulatorischen Sequenzen bzw. Faktoren konnen dabei wie 
5 oben beschrieben vorzugsweise die Genexpression der eingefiihrten 
Gene positiv beeinflussen nnd dadurch erhohen. So kann eine Ver- 
starkung der regulatorischen Elemente vorteilhaf terweise auf der 
Transkriptionsebene erfolgen, indem starke Transkriptionssignale 
wie Promotoren luid/oder "Enhancer" verwendet werden. Daneben ist 
10 aber auch eine VerstSrkimg der Translation moglich, indem bei- 
spielsweise die Stabilitat der rtiKNA verbessert wird. 

Ein weiterer Aspekt der Erfindung betrifft Vektoren, z.B. 
rekombinante Expressionsvektoren, die mindestens eine der erf in- 

15 dungsgeitiafien Expressionskassetten enthalten^ und Wirtszellen, in 
die die erf indungsgemSfien Expressionskassetten oder diese Vekto- 
ren eingebracht worden sind, insbesondere Mikroorganismen, Pflan- 
zenzellen, Pf lanzengewebe, -orgeme oder ganze Pflanzen. Bei einer 
Ausfuhrungsform kann eine solche Wirtszelle Feinchemikalien-Ver- 

20 bindungen, insbesondere PUFAs, speichem; zur Isolation der ge- 
wtinschten Verbindung werden die Zellen geerntet. Die Verbindung 
(Ole, Lipide, Triacylglycerider Fettsauren) oder die Deeaturase 
konnen dann aus dem Medium oder der Wirtszelle, welche bei Pflan- 
zen Zellen sind, die Feinchemikalien enthalten oder speichem, am 

25 starksten bevorzugt Zellen von Speichergeweben, wie Samenhiillen, 
Knollen, Epidermis- xind Samenzellen, Endosperm oder Embyrogewebe 
isoliert werden. 

Noch ein weiterer Aspekt der Erfindung betrifft eine genetisch 
30 ver&iderte transgene Pflanze, bevorzugt ein 6lfruchtpflanze, wie 
vorstehend erwahnt, besonders bevorzugt eine Raps- oder Lein- 
pflanze, in die eine erf indungsgemaSe Expressionskassette, die 
vorteilhaf t weitere Gene wie Desattirasegen enthalt, eingebracht 
worden ist. Bei einer Aus fuhnzngs form ist das Genom von Raps oder 
35 Lein durch Einbringen einer erf indungsgemaEen Expressionskassette 
vorteilhaft enthaltend weitere NukleinsSuremolekUle, die beis- 
pielsweise eine Wildtyp- oder mutierte Desaturasesequenz kodiert, 
als Transgen verSndert worden. Bei einer bevorzugt en Ausfuhrungs- 
form wird Raps oder Lein auch zur Produktion einer gewunschten 
40 Verbindung, wie Lipiden und Fettsauren, wobei PUFAs besonders be- 
vorzugt sind, verwendet. 

Bei noch einer weiteren bevorzugten Aus fUhrungs form kann das 
Moos Physcomitrella patens zur Demonstration der Funktion eriner 
45 Expressionskassette mit einem Desaturasesegen unter Verwendung 
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homologer Rekombination auf der Basis der in dieser Erfind\ang be- 
, schriebenen NukleinsSuren verwendet werden. 

Das Desaturasepolypeptid oder ein biologisch aktiver Tell davon 
5 kann vorteilhaft unter Kontrolle der erf indxingsgemaSen Expres- 
sionskassette funktionsf ahig mit einem weiteren Polypeptid, das 
eine andere enzymatische Aktivitat als die Desaturasen hat bei- 
spielsweise eine Elongase-, Acyl transferase- oder sonstige Akti- 
vitat verbiinden werden, so dass ein Fusionsprotein gebildet wird. 

10 Vorteilhaft hat dieses Fusionsprotein eine Aktivitat, die 
sich von derjenigen der Desatxurase allein unterscheidet . Bei 
anderen bevorzugten Aus f Uhrungs f orm ninunt dieses Fusionsprotein 
am Stoffwechsel von Verbindungen , die zur Synthese von Lipiden 
und Fettsauren, Cofaktoren und Enzymen in Mikroorganismen oder 

15 Pflanzen notwendig sind, oder am Transport von Molekiilen liber 
diese Meinbranen teil. Besonders vorteilhaft moduliert das Ein- 
bringen dieses Fusionsproteins in einer Wirtszelle die Produktion 
einer gewiinschten Verbindimg innerhalb einer xmd durch die Zelle. 
Bei einer bevorzugten Ausfiihrungsf orm enthalten diese Fusion- 

20 sproteine auch A-4-, A-5- oder A-8-, A-15, A-17 oder 

A-19-Desaturaseaktivitaten allein oder in Kombination . Ins- 
besondere solche Genkombinationen sind bevorzugte Ausfiihrvmgs- 
formen, die aus SEQ ID WO: 7 oder 9 gewahlt sind, bzw Teilen 
davon, Derivate oder ihren Horaologen. Insbesondere solche 

25 Kombinationen sind bevorzugt, die die vollstMndige Protein- 
aktivitat wie in SEQ ID NO: 1, 3, 5 oder 11 enthalten und in 
Multiexpressionskassetten definiert durch SEQ ID NO: 13 , 14, f 
15, 16 \md 17 eingefugt zur Transformation von Pflanzen und 1 
Expression in Pflanzen geeignet sind. 

30 

Eingehende Beschreibung der Erfindung 

Ein erfindungsgemaiSer Gegenstand sind auch die Expressionskasset- 
ten in Verbindung mit isolierten Nukleinsauresequenz (en) , die far 
35 ein Polypeptid mit DesaturaseaktivitSt codiert, ausgewahlt aus 
der Gruppe: 

a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, 
SEQ ID NO: 3, SEQ ID NO: 5 Oder SEQ ID NO: 11 dar- 

40 gestellten Sequenz, 

b) NukleinsSuresequenzen, die aufgrund des degenerierten 
genetischen Codes durch RuckUbersetzung der in SEQ ID NO: 2, 
SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 12 darges tell ten 

45 AminosSuresequenzen erhalten werden, 
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c) Derivate der in SEQ ID- NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 
Oder SEQ ID NO: 11 dargestellten Nukleinsauresequenz, 
die far Polypeptide rait der in SEQ ID NO: 2, SEQ ID NO: 4, 
SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten Aminosaurese- 
5 guenzen codieren und mindestens 50 % Homologie auf Amino- 

saureebene aufweisen, ohne daS die enzymatische Wirkung der 
Polypeptide wesentlich reduziert ist* 

Weiterhin betrifft die Erfindung eine Aminosauresequenz , die 
10 durch die oben genaimte(n) NukleinsSuresequenz (en) codiert werden 
(ftir die Erfindung soil der Singular den Plural und umgekehrt 
xjjiifassen) . Speziell betrifft die Erfindung Aminosauresequenzen, 
die durch die in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder 
SEQ ID NO: 11 dargestellte Seguenz codiert werden. 

15 

Die vorliegende Erfindung stellt Express ionskassett en bereit, die 
ftir die Expression von Nukleinsauren und Proteinmolekiiie mit De- 
saturaseaktivitat geeignet sind, und von Nukleinsauren kodierend 
ftir Proteine, die am Stoffwechsel von Lipiden und Fettsauren, 

20 PUFA-Cofaktoren und Enzymen in deiu Moos Physcomitrella patens 
Oder am Transport lipophiler Verbindungen uber Membranen betei- 
ligt sind. Die erf indungsgemafien Verbindungen lassen sich zur Mo- 
dulation der Produktion von Peinchemikalien aus Organismen wie 
Pflanzen, wie Mais, Weizen, Roggen, Hafer, Triticale, Reis, Ger- 

25 ste, Sojabohne, Erdnuss, Baumwolle, Linum Art en wie 01- oder Fa- 
serl-ein, Brassica-Arten, wie Raps, Canola \and RtLbsen, Pfeffer, 
Sonnenblume , Borretsch, Nachtkerze und Tagetes, Solanacaen-Pf lan- 
zen, wie Kartoffel, Tabak, Aubergine und Tomate, Vicia-Arten, 
Erbse, Maniok, Alfalfa, Buschpflanzen (Kaffee, Kakao, Tee) , Sa- 

30 lix-Arten, Bai:ime (Olpaliae/ Kokosnuss) und ausdauemden Grasem 
und Putter feldfruchten, entweder direkt (z.B. wenn die Uberex- 
pression oder Optimierung eines Fettsaurebiosynthese-Proteins ei- 
nen direkten Einfluss auf die Ausbeute, Produktion und/ oder Effi- 
zienz der Produktion der FettsMxire aus modifizierten Organismen 

35 hat)' verwenden oder konnen eine indirekt Auswirkung haben, die 
dennoch zu einer Steigerung der Ausbeute, Produktion und/oder Ef- 
fizienz der Produktion einer gewiinschten Verbindung oder einer 
Abnahme unerwunschter Verbindungen ftihrt (z.B, wenn die Modula- 
tion des Stof fwechsels von Lipiden und FettsSuren, Cofaktoren und 

40 Enzyitien zu VerSnderungen der Ausbeute, Produktion und/oder Ef fi- 
zienz der Produktion oder der Zusammensetzung der gewiinschten 
Verbindungen innerhalb der Zellen ftihrt, was wiederum die Produk- 
tion einer oder mehrerer Feihchemikalien beeinf lussen kann) . As- 
pekte der Erf indiing sind nachstehend weiter erlautert . 

45 

I. Feinchemikalien \md PUFAs 
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Der Begriff "Feinchemikalie" ist ira Fachgebiet bekannt und 
umfasst Molekule, die durch einen Organismus produziert worden 
sind iind Anwendungen in verschiedenen Indus trien finden, wie, 
aber nicht beschrSnkt auf, die pharmazeutische, Landwirtschafts-, 
5 Nahrixngsiriittel- und Kosnietik- Industrie. Diese Verbindungen um- 
fassen Lipide, FettsSuren, Cofaktoren und Enzyme usw. (wie z.B. 
beschrieben in Kuninaka, A. (1996) Nucleotides and related com- 
pounds, S. 561-612, in Biotechnology Bd. 6, Rehm et al., Hrsgb./ . 
VCH: Weinheiin und darin enthaltenen Literaturstellen) , Lipide, 

10 gesattigte xind ungesattigte Fettsauren (z.B. Arachidonsaure) , 
Vitamine und Cofaktoren (wie beschrieben in Ullmami's Ency- 
clopedia of Industrial Chemistry, Bd. A27, Vitaiains, S. 443-613 
(1996) VCH: Weiniieim und darin enthaltenen Literaturstellen; 
und Ong, A.S., Niki, E., & Packer, L. (1995) Nutrition, Lipids, 

15 Health and Disease Proceedings of the UNESCO/Confederation of 
Scientific and Technological Associations in Malaysia and the 
Society for Free Radical Research - Asian, abgehalten am 1.-3. 
Sept. 1994 in Penang, Malysia, AOCS Press (1995)), Enzyme und 
s&itliche anderen von Gutcho (1983) in Chemicals by Fermentation, 

20 Noyes Data Corporation, ISBN: 0818805086, und darin angegebenen 
Literaturstellen beschriebenen Chemikalien. Der Stoffwechsel \md 
die Verwendungen bestimmter Peinchemikalien sind nachstehend 
weiter erlautert. 

25 Die Kombination verschiedener Vorlaufermolekaie und Biosynthese- 
enzyme fiihrt zur Herstellung verschiedener Fettsauremolekiile, was 
eine entscheidende Auswirkung auf die Zusammensetzung der Membran 
hat. Es kann angenommen werden, dass PUFAs nicht nur einfach in 
Triacylglycerin, sondem auch in Membranlipide eingebaut werden. 

30 

Voriaufer fur die PUFA-Biosynthese sind beispielsweise QlsSure, 
Linol- und LinolensSure . Diese Cia-Kohlenstof f-Fettsauren 
mtlssen auf C20 und C22 verlangert werden, damit Fettsauren 
vom Eicosa- und Docosa-Kettentyp erhalten werden. Mithilfe 

35 verschiedener Desaturasen,' wie Enzymen, welche A-12-Desaturase, 
A-15-Desaturase, A-6-Desaturase-, A-5- und A-4-Desaturase- 
aktivitat aufweisen, konnen Arachidonsaure , EicosapentaensSure 
und Docosahexaensaure sowie verschiedene andere langkettige PUFAs 
erhalten, extrahiert und ftir verschiedene Zwecke bei Nahrungs- 

40 mittel-, Futter-, Kosmetik- oder pharmazeutischen Anwendungen 
verwendet werden . 

Zur Herstellung langkettiger PUFAs mUssen, wie oben erwShnt, 
die mehrfach ungesattigten Cis- bzw C2o-Fettsauren mehrfach 
45 desaturiert werden. Die erfindungsgemSSen NukleinsS.uresequenzen 
kodieren erste funktionell aktive Desaturasen aus Phyeodactylum 
tricomutum, einem Mikroorganismus, der PUFAs in der Triacyl- 
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glycerol fraktion enthSIt. Mit den erf indungsgemaSen Desaturasen 
konnen Doppelbindungen in die Oder A-12 -Position ein- 

gefuhrt warden. Die Aktivitaten der erfindungsgemai^en Desaturasen 
ftihrt vorzugsweise zu Cx8~ + Czo-FettsSuren itiit mindestens zwei, 
5 drei, vier oder fxinf Doppelbindungen im Fettsauremolekiil, vor- 
zugsweise zu C20"P^ttsauren mit vorteilhaft drei, vier oder 
fiinf Doppelbindiingen im Fetts^uremolekiil . Die Desaturier\ing kann 
vor Oder nach Elongation der entsprechenden FettsSure erfolgen. 
Daher fiihren die Produkte der Desaturaseaktivitaten und der mdg- 

10 lichen weiteren Desaturierung und Elongation zu bevorzugten PUFAs 
mit hSherem Desaturierungsgrad, einschliefilich einer weiteren 
Elongation von C20 C22"FettSauren, zu FettsSuren wie LinolsSure, 
Docosadiensaure , dihomo-Y-linolensaure , Arachidonsaure , COS-Eicosa- 
triendihomo-7-linolensaure, Eicosapentaensaure, (03-Eicosatrien- 

15 saure, 0)3-Eicosatetraensaure, Docosapentaensaure oder Docosa- 
hexaensaure. Substrate dieser erfindungsgemafien EnzymaktivitSt. 
sind zum Beispiel Taxolsaure, 5 , 9-Octadecadiensaure, Olsaure, 
Linolsaure, 7-LinolensS.ure, Pinolensaure, a-Linolensaure, Ara- 
chidonsaure, Eicosapentaensaure oder StearidonsSure. Bevorzugte 

20 Substrate sind LinolsSure, y-Linolensaure und/oder a-Linolensaure, 
dihomo-y-linolensaure bzw. Arachidonsaure, Eicosatetraensaure 
oder Eicosapentaensaure. Die Cia-oder C20-Fettsauren mit min-. 
destens zwei Doppelbindungen in der PettsSure kdnnen durch die 
erf indungsgemaJSe Enzymaktivitat in Form der freien Fettsaure oder 

25 in Form der Ester, wie Phospholipide, Glykolipide, Sphingolipide, 
Phosphoglyceride , Monoacylglyceride, Diacylglyceride, Triacylgly- 
ceride oder sonstlge Ester, verlangert werden. 
Ferner miissen Fettsauren anschlieEend an verschiedene 
Modif ikationsorte transportiert und in das Triacylglycerin- 

30 Speicherlipid eingebaut werden, Ein weiterer wichtiger Schritt 
bei der Lipidsynthese ist der Transfer von Fettsauren auf die 
polaren Kopfgruppen, beispielsweise durch Glycerin-Fettsaure- 
Acyl transferase (siehe Frentzen, 1998, Lipid, 100 (4-5 ): 161-166) . 

35 Veroffentlichungen liber die Pflanzen~FettsSurebi6synthese, 
Desaturierung, den Lipidstof fwechsel und Membran transport 
von fetthaltigen Verbindungen , die Betaoxidation, FettsSure- 
modifikation und Cofaktoren, Triacylglycerin-Speicherung und 
-Assemblierung einschlieSlich der Literaturstell^n darin siehe 

40 in den folgenden Artikeln: Kinney, 1997, Genetic" Engeneering, 
Hrsgb.: JK Setlow, 19:149-166; Ohlrogge iind Browse, 1995, Plant 
Cell 7:957-970; Shanklin und Cahoon, 1998, Annu. Rev. Plant 
Physiol. Plant Mol. Biol. 49:'611-641; Voelker, 1996, Genetic 
Engeneering, Hrsgb.: JK Setlow, 18:111-13; Gerhardt, 1992, Prog. 

45 Lipid R. 31:397-417; GlLhnemann-Schaf er & Kindl, 1995, Biochim. 
Biophys Acta 1256:181-186; Kunau et al., 1995/ Prog. Lipid Res. 
34:267-342; Stymne et al., 1993, in: Biochemistry and Molecular 
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Biology of Membrane and Storage Lipids of Plants, Hrsgb. : 
Murata und Somerville, Rockville, American Society of Plant 
Physiologists, 150-158, Murphy & Ross 1998, Plant Journal. 
13(1) :1-16. 

5 

Vitamine, Cofaktoren \ind Nutraceutical wie PUFAs, umfassen eine 
Gruppe von Molekulen, die hohere Tiere nicht mehr synthetisieren 
kannen \ind somit aufnehmen mussen oder die hShere Tiere nicht 
mehr ausreichend selbst herstellen konnen und somit zusatzlich 

10 aufnehmen mussen, obwohl sie leicht von anderen Organismen, wie 
Bakterien, synthetisiert werden. Die Biosynthese dieser Molekule 
in Organismen, die sie produzieren kSnnen, wie in Bakterien, 
ist im groSen und ganzen charakterisiert worden (Ullmann's- 
Encyclopedia of Industrial Chemistry, "Vitamins", Bd. A27, 

15 S. 443-613, VCH: Weinheim, 1996; Michal, G, (1999) Biochemical 
Pathways: An Atlas of Biochemistry and Molecular Biology, 
John Wiley & Sons; Ong, A.S., Niki, E., & Packer, L. (1995) 
''Nutrition, Lipids, Health and Disease" Proceedings of the 
UNESCO/ Confederation of Scientific and Technological Associations 

20 in Malaysia and the Society for Free Radical Research Asia, 

abgehalten am 1.-3. Sept. 1994 in Penang, Malaysia, AOCS Press, 
Champaign, II* X; 374 S) . 

Die oben erwShnten Molekule sind entweder selbst biologisch 

25 aktive Molekule oder Vorstufen biologisch aktiver Substanzen, die 
entweder als Elektronentibertrager oder Zwischenprodukte bei einer 
Vielzahl von Stof fwechselwegen dienen. Diese Verbindungen haben 
neben ihrem N^hrwert auch einen signif ikanten industriellen Wert 
als Farbstoffe, Antioxidantien und Katalysatoren oder andere Ver- 

30 arbeitungshilfsstoffe. (Einen Uberblick liber Struktur, Aktivitat 
und Indus trielle Tto^rendungen dieser Verbindungen siehe z.B. 
in Ullmann's Encyclopedia of Industrial Chemistry, ''Vitamins", 
Bd. A27, S. 443-613, VCH: Weinheim, 1996). Mehrfach ungesattigte 
FettsSuren haben verschiedene Funktionen und gesundheitsfdrdernde 

35 Wirkungen, beispielsweise bei koronarer Herzerkrankung, Ent- 
ztlndiingsmechanismen, Kinderemahrung usw. Verof fentlichungen 
und Literaturstellen, einschlieSlich darin zitierter Literatur- 
stellen, siehe in: Simopoulos, 1999, Am. J. Clin. Nutr. 70 
{3. Suppl. ): 560-569, Takahata et al., Biosc. Biotechnol. Biochem. 

40 1998, 62 (11) :2079-2085, Willich xind Winther, 1995, Deutsche 
Medizinische Wochenschrif t 120(7} :229ff . 

II. ElemexLte und Verfahren der Erfindung 

45 Die vorliegende Erfindung beruht unter anderem auf der Entdeckung 
neuer Molekule, die hier als Desaturasenukleinsaure- und 
-proteinmolektile bezeichnet werden, welche ein© Wirkung auf 
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die Produktion von Zellmembranen mid Lipiden Phaeodactylum tri- 
cornutum ausiiben und beispielsweise die Bewegung von Molekiilen 
iiber diese Membranen beeinf lussen. Bei einer Ausfiihrungsf om 
nehmen die Desaturasemolekiile am Stoffwechsel von ztrni Aufbau von 
5 Zellmembranen in Organismen, wie Mikroorganismen xind Pflanzen, 
notwendigen Verbindungen teil oder beeinf lussen indirekt den 
Transport von Molekiilen iiber diese Membranen. Bei einer bevor- 
zugten Ausfiihrungsform hat die Aktivitat der erf indxingsgemaSen 
Desaturasemolekiile zur Regulation der Produktion von Membran- 

10 komponenten und des Membrantransports eine Auswirkung auf 
die Produktion der gewiinschten Feinchemikalie durch diesen 
Organismus . Bei einer besonders bevorzugten Ausfiihrungsform 
ist die Aktivitat der erf indungsgemaJSen Desaturasemolekiile 
moduliert, so dass die Ausbeute, Produktion und/ oder Effizienz 

15 der Produktion der Stof fwechselwege von Mikroorganismen oder 
Pflanzen, welche die erf indungsgemaSen Desaturasen regulieren, 
moduliert sind und die Effizienz des Transport von Verbindungen 
durch die Membranen verandert ist, was entweder direkt oder 
indirekt die Ausbeute, Produktion und/ oder Effizienz der 

20 Produktion einer gewiinschten Feinchemikalie durch Mikroorganismen 
und Pflanzen moduliert. 

Der Begriff "Desaturase" oder *Desaturasepolypeptid" umfasst 
Proteine, die an der Desaturierung von FettsSuren teilnehmen. 

25 Beispiele . fiir Desaturasen sind in der SEQ ID NO: 1, 3, 5, 11 
Oder ihren Homologen, Derivaten oder Analoga offenbart. Die 
Begriff e Desaturase oder Desaturasenukleinsauresequenz (en) 
umfassen Nukleinsaureseguenzen; die eine Desaturase kodieren 
und bei denen ein Teil eine kodierende Region tmd ebenfalls 

30 entsprechende 5'- und 3 '-untranslatierte Sequenzbereiche sein 
kdnnen. Beispiele ftir Desaturase-Gene sind die in SSQ ID NO: 1, 
3, 5 oder 11 darges tell ten. Die Begriff e Produktion oder 
Prodiiktivitat sind im Fachgebiet bekannt und beinhalten die 
Konzentration des Fementationsproduktes (zum Beispiel der 

35 gewiinschten Feinchemikalie) , das in einer bestimmten Zeitspanne 
\md einem bestimmten Ferment at ions volijmen gebildet wird (z.B» 
kg Produkt pro Stimde pro Liter) , Der Begriff Effizienz der 
Produktion umfasst die Zeit, die zur Erzielung einer bestimmten 
Produktionsmenge n5tig ist (z.B. wie lange die Zelle zur Auf- 

40 richtung einer bestimmten Durchsatzrate einer Feinchemikalie 
benotigt) , Der Begriff Ausbeute oder Produkt/Kohlenstof f- 
Ausbeute ist im Fachgebiet bekannt und iimfasst die Effizienz 
der Umwandlung der Kohlenstoff quelle in das Produkt (d.h. die 
Feinchemikalie) . Dies wird gewdhnlich beispielsweise ausgedruckt 

45 als kg Prodvikt pro kg Kohlenstoff que lie. Durch Erhdhen der 
Ausbeute oder Produktion der Verbindung wird die Menge der 
gewonnenen I4olekiile oder der geeigneten gewonnenen MolekCile 
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dieser Verbindung in einer bestinnnten Kulturmenge uber einen 
festgelegten Zeitraum erhoht. Die Begriffe Biosyntiiese oder 
Biosyntheseweg sind im Fachgebiet bekannt und \jmfassen die 
Synthase einer Verbindung, vorzugsweise einer organischen Ver- 
5 bindung, durch eine Zelie aus Zwischenverbindungen, beispiels- 
weise in einem Mehrschritt- \ind stark regulierten Prozess. Die 
Begriffe Abbau oder Abbauweg sind im Fachgebiet bekannt xind 
umfassen die Spaltung einer Verbindung, vorzugsweise einer 
organischen Verbindung, durch eine Zelle in Abbauprodukte 

10 (allgemeiner gesagt, kleinere oder weniger komplexe Molekiile) 
beispielsweise in eineia Mehrschritt- "und stark regulierten 
Prozess. Der Begriff Stoffwechsel ist im Fachgebiet bekannt 
\md \iinfasst die Gesamtheit der biochemischen Reaktionen, die in 
einera Organismus stattfinden. Der Stoffwechsel einer bestimmten 

15 Verbindung (z.B. der Stoffwechsel einer Fettsaure) umfasst dann 
die Gesamtheit der Biosynthese- , Modif ikations- xind Abbauwege 
dieser Verbindung in der Zelle, die diese Verbindung betreffen. 

Bei einer anderen Aus fiihrungs form konneh die erfindungsgemSSen 

20 NukleinsSuresequenzen, die ftir Desaturase-Molektlle codieren, die 
Produktion eines gewUnschten Mblekttls, wie einer Feinchemikalie/ 
in einem Mikroorganismus oder in Pflanzen modulieren. Es gibt 
eine Reihe von Mechanismen , durch die die Veranderxmg einer 
erfindungsgemafien Sequenz die Ausbeute, Produktion und/oder 

25 Effizienz der Produktion einer Feinchemikalie aus einem Mikro- 
organismus- Oder Pf lanzenstamm, die dieses veranderte Protein 
enthalten, direkt beeinflussen kann. Die Anzahl oder Aktivitat 
von Desaturasen, die am Transport von Feinchemikalienmolekiilen 
innerhalb oder aus der Zelle beteiligt sind, kann erhoht werden, 

30 so dass grofiere Mengen dieser Verbindungen iiber Membranen trans- 
portiert werden, aus denen sie leichter gewonnen lund ineinander 
umgewandelt werden. Ferner sind FettsSuren, Triacylglycerine 
und/oder Lipide selbst i-mnschenswerte Feinchemikalien; durch 
Optimierung der Aktivitat oder Steigem der Anzahl einer oder 

3S mehrerer erf indungsgemafier Desaturasen, die an der Biosynthese 
dieser Verbindungen beteiligt sind, oder durch Storen der Aktivi- 
tat einer oder mehrerer Desaturasen, die am Abbau dieser Ver- 
bindungen beteiligt sind, kann es mdglich sein, die Ausbeute, 
Produktion und/oder Effizienz der Produktion von FettsSure- und 

40 Lipidmoleklilen aus Organismen, wie Mikroorganismen oder Pflanzen, 
zu erhdhen. 

Die Mutagenese der genannten Nukleins^uresequenzen kann Desatxira- 
sen mit verSnderten Aktivitaten hervorbringen , welche die Produk- 
45 tion einer oder mehrerer gewOnschter Feinchemikalien aus Mikroor- 
ganismen Oder Pflanzen indirekt beeinflussen. Beispielsweise kon- 
nen Desaturasen, die am Export von Abfallprodukten beteiligt 
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sind, eine groSere Anzahl oder h6here Aktivitat aufweisen, so 
dass die normal en Stof fwechselabf Slle der Zelle (deren Menge mog- 
licherweise aufgrund der tiberproduktion der gewiinschten Feinche- 
laikalie erhoht ist) effizient exportiert warden, bevor sie die 
5 Molekule in der Zelle schSdigen kOnnen (was die Lebensf ahigkeit 
der Zelle herabsetzen wtirde) oder die Feinchemikalien-Biosynthe- 
sewege st^5ren konnen (was die Ausbeute, Produktion oder Effizienz 
der Produktion einer gewiinschten Feinchemikalie senken wOrde) . 
Die relativ groSen intrazellularen Mengen der gewiinschten Fein- 
, 10 chemikalie selbst konnen ferner fiir die Zelle toxisch sein, so 
dass man durch Steigern der Aktivitat oder Anzahl von Trans- 
portern, die diese VerbindTJngen aus der Zelle exportieren kOnnen, 
die Lebensf ahigkeit der Zelle in Kultur steigern kann, was wie- 
derxom zu einer groEeren Anrahl an Zellen in der Kultur fuhrt, 

15 welche die gewiinschte Feinchemikalie produzieren. Die Desaturasen 
konnen auch so manipuliert werden, dass die entsprechenden Mengen 
unterschiedlicher Lipid- und Fettsauremolekiile produziert werden. 
Dies kann eine erhebliche Auswirkung auf die Lipidzusammensetzxing 
der Zellmembran haben. Da jeder Lipidtyp unterschiedliche physi- 
. 20 kalische Eigenschaf ten aufweist, kann eine VerSnderung der Lipid- 
zusammensetzung einer Membran die Membranf luiditat signifikant 
verandern. Anderungen der Membranf luiditat konnen den Transport 
. von Molekiilen uber die Membran sowie die Integritat der Zelle 
beeinflussen, was jeweils eine erhebliche Auswirkung auf die 

25 Produktion von Feincheiuikalien aus Mikroorganismen und Pf lanzen 
in Fermentationskultur im groSen MaSstab hat. Pf lanzenmembranen 
verleihen spezifische Eigenschaf ten, wie Toleranz gegentiber 
warme, Kaite, Salz, Trockenheit sowie Toleranz gegen Pathogens, 
wie Bakterien und Pilze. 

30 

Uie genaimten isolierten WukleinsSuresequenzen sind im Genom ei- 
nes Phaeodactylum tricornutum tJTEX646-Stammes enthalten, der uber 
die Algensammlung der University of Texas, Austin verfugbar ist. 

35 Die Ntikleotidsequenz der Phaeodactylum tricomutum-cDNA und die 
abgeleiteten Aminosauresequenzen der Desaturasen sind in den 
SEQ ID NO: 1 bis 6 sowie 11 und 12 gezeigt. Es wurden Computera- 
nalysen durchgefilhrt, die diese Nukleotidsequenzen als Sequenzen 
klassif izieren und/oder identifizieren, die am Stoffwechsel von 

40 Zellmembrankoniponenten beteiligte Proteine oder am Transport von 
Verbindungen liber Zellmembranen beteiligte Proteine bzw. der PUFA 
Biosynthese codieren. EST's mit der Datenbankeingabe-^NO : 
PT001070010R und PT001078032R durch die Erfinder stellen die er- 
findungsgemaSen Sequenzen in SEQ ID NO: 1 und 3 dar. Die Sequenz 

45 des Fragments aus EST PT001070010R wurde ermittelt und ist wie 
dargestellt in SEQ ID NO: 5. Analog, ist die Sequenz des Klones 
PT001078032R dargestellt in SEQ ID NO: 1. Den Klonen wurden Gen- 
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namen zugewiesen. AbkUrzungen bedeuten: Pp = Physcomitrella pa- 
tens, Pt = Phaeodactyluiti tricornutum. PT001070010R aus SEQ ID NO: 
5 codiert fair ein neues Gen homolog zu A-12-Desaturase \md 
PT001078032R codiert fiir eine neuartige A-5-Desaturase . Pt_des6 
5 kann gemafi Beispiel 5a mittels Polymerase Kettenreaktion unter 
Zuhilfenahme degenerierter Oligonukleotide isoliert werden. Ein 
so erhaltenes Fragment kann zum Sichten einer cDNA Bank aus 
PhaeodactyltJia tricomutuin isoliert werden \ind die codierende Re- 
gion einer Phaeodactylum tricornutum A-6-Desaturase erhalten wer- 

10 den. Ein so isoliertes Gen wird in Tabelle 1 als Pt_des6 bezeich- 
net und ist in SEQ ID NO: 3 dargestellt. Die korrespondierenden 
Aminosauresequenzen werden durch Obersetzung des genetischen Co- 
des der Seguenz ID NO: 1, 3 und 5 erhalten und sind als SEQ ID 
NO: 2, 4 und 6 definiert (siehs auch Tabelle 1). Auch eine wei- 

15 tare NukleinsS^uresequenz, die fur eine A-12-Desaturase codiert, 
ist Tabelle 1 zu entnehmen. Sie tragt die Klon-Nuiraner 
PT001072031R. 

Tabelle 1 

20 



25 





Genname 


Klonname 


Nukleins^ure 
SEQ ID NO: 


Polypeptid 
SEQ ID NO: 


D5 Desaturase 


Pt_.de35 


PT001078032R 


1 


2 


D6 Desaturase 


Pt_des6 


Pt_des6 


3 


4 


D12 Desaturase 


Pt„desl2 


PT001070010R 


5 


6 


D6 Desaturase 


Pp_des6 


Pp_des6 


7 


8 


D6 Elongase 


Pp_PSEl 


PP001019019F 


9 


10 


A12 Desaturase 


Pt desl2.2 


PT001072013R 


11 


12 



30 Die vorliegende Erfindung betrifft auch Proteine mit einer Amino- 
sauresequenz , die im wesentlichsn homolog zu einer AminosSure- 
sequenz der SEQ ID NO: 2, 4, 6 oder 12 ist. Wie hier verwendet, 
ist ein Protein mit einer Aminos aures equenz , die im wesentlichen 
homolog zu einer ausgewahlten Amino sSures equenz ist, zu min- 

35 destens etwa 50 % homolog zu der ausgewahlten Amino sSures equenz, 
z.B. der gesamten ausgewahlten Aminosaures equenz . Ein Protein mit 
einer Aminos aures equenz, die im wesentlichen homolog zu einer 
ausgewahlten Aminosauresequenz 1st, kann auch zu mlndestens etwa 
50. bis 60 %, vorzugsweise mindestens etwa 60 bis 70 % und starker 

40 bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 % oder 90 bis 
95 % und am starksten bevorzugt mindestens etwa 96 %, 97 %, 98 %, 
99 % Oder mehr homolog zu einer ausgewahlten Aminosauresequenz 
sein. ■ 

45 Die Desaturasen oder der biologisch aktive Telle oder Fragmente 
davon kdnnen am Stof fwechsel von Lipiden zum Aufbau von Zellmem- 
branen oder Speicher lipiden in Organismen teilnehmen und in Kom- 
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bination init weiteren Genen, insbesondere solchen mit Elongaseak- 
tivitat zur Elongation von Cis-^zvv C20-22-PUFAS benotigten Aktivi- 
taten beitragen, so dass Cig, C22- oder C24-PUFAS sowie ver- 

wandte PUFAs erhalten werden. 
5 " '--..> 

Dabei konnen die Desaturasen in Kombination mit Elongasen imd an- 
deren Desaturasen in erf indungsgemSEen Express ions kassetten klo- 
niert werden und zur -Transformation von Pflanzen mithilfe von 
Agrobakterium eingesetzt werden. 

10 

Verschiedene Aspekte der Erfindung sind eingehender in den 
folgenden Unterabschnitten beschrieben. 

A. Isolierte Nukleins^uremolekule 

15 

Eine Ausftihrungsform der Erfindung sind isolierte NukleinsSluren, 
die von PUFA produzierenden Mikroorganismen stainiaen und ftir Poly- 
peptide kodieren, die Cig-oder C2o-22-Fettsauren mit mindestens 
einer, zwei, drei oder vier Doppelbindungen in der Fettsaure 
20 desaturieren. 

Eine weitere erf indungsgemaJSe Ausfuhrungsf orm sind isolierte 
Nukleinsauren, umfassend Nxikleotidsequenzen/ die fiir Polypeptide 
kodieren, die Ci8~bzw C20-Fettsauren mit mindestens ein, zwei, 
25 drei oder vier Doppelbindungen in der Fettsture desaturieren 
und sind aus der Gruppe, bestehend aus 

a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, 
SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 11 dar- 

30 gestellten Seguenz, 

b) Nukleinsauresequenzen, die aufgrimd des degenerierten 
genetischen Codes durch. Rtickiibersetzxjng der in SEQ ID NO: 2, 
SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 12 darges tell ten 

35 Aminosauresequenzen erhalten werden, 

• c) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 
Oder SEQ ID NO: 11 dargestellten Nukleinsauresequenz, die 
ftir Polypeptide mit der. in SEQ ID NO: 2, SEQ ID NO: 4, 
40 SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten Aminosaure- 

sequenzen codieren und mindestens 50 % Homologie auf Amino- 
sSureebene aufweisen, ohne dass die enzymatische Wirkung 
der Polypeptide wesentlich reduziert ist. 



45 
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Die oben genannte erf indungsgemSfie NukleinsSure stammt von 
Organismen, wie Ciliaten, Pilzen, Algen oder Dinof lagellaten, 
die PUFAs synthetisieren kdnnen, vorzugsweise von Phaeodactylum 
tricomutum oder nah vei^Arandten Orgemismen. 

5 

Ein Aspekt der Erfindxing betrifft isolierte Expressionskassetten 
sowie Nukleins^uremolekUle, die Desaturase-Polypeptide oder bio- 
logisch aktive Teile davon kodieren, sowie Nukl eins^ure fragment e 
von diesen, die zur Verwendung als Hybridisierungssonden oder 

10 Primer zur Identif izierung oder Amplifizierung einer Desaturase- 
kodierenden NukleinsSure (z.B. Desaturase-DNA) ausreichen. Der 
Begriff "Nxikleinsauremolekul " ; wie hier verwendet, soil DNA-Mole- 
kiile (z.B. cDNA oder genomische DNA) und RNA-Molekule (z.B. itiRNA) 
sowie DNA- Oder RNA-Analoga, die mittels Nukleotidanaloga erzeugt 

15 werden, lamfassen. Dieser Begriff umfasst zudem die am 3'- imd am 
5'-Ende des kodierenden Genbereichs gelegene untranslatierte Se- 
quenz: mindestens 500/ bevorzugt 200, besonders bevorzugt 100 Nu~ 
kleotide der Sequenz stromaufwarts des 5'-Endes des kodierenden 
Bereichs und mindestens 100, bevorzugt 50, besonders bevorzugt 20 

20 Nukleotide der Sequenz stromabwarts des 3'-Endes des kodierenden 
Genbereichs. Das NukleinsauremolekUl kann einzelstrangig oder 
doppelstrSngig sein, ist aber vorzugsweise doppelstrangige DNA. 
Ein "isoliertes" Nukleinsauremolekul wird von anderen NukleinsSu- 
remolekiilen abgetrennt, die in der naturlichen Quelle der Nu- 

25 kleinsauxe vorliegen. Eine "isolierte" NukleinsSure hat vorzugs- 
weise keine Sequenzen, welche die Nukleinsaure in der genomischen 
DNA des Organismus, aus dem die Nukleinsaure stammt, nattirlicher- 
weise flankieren (z.B, Sequenzen, die sich an den 5'- und 3 '-En- 
den der Nukleinsaure befinden) . Bei verschiedenen Ausftihrungsfbr- 

30 men kann das isolierte Desaturase-Nukleinsauremolekul zum Bei- 
spiel weniger als etwa 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb oder 
0,1 kb an Nukleotidsequenzen enthalten, die naturlicherweise das 
NukleinscLuremolekai in der genomischen DNA der Zelle, aus der die 
Nukleinsaure stammt (z.B. eine Physcomitrella pateris-Zelle) 

35 flankieren. Ein "isoliertes" Nukleinsauremolekul, wie ein cDNA- 
Molekiil, kann iiberdies im wesentllchen frei von anderem zellu- 
ISreu Material oder Kulturmedi\im sein, wenn es durch rekombinante 
Techniken hergestellt wird, oder frei von chemischen Vorstufen 
Oder anderen Chemikalien sein, wenn es chemisch syrithetisiert 

40 wird. 

Ein erf ind\mgsgemaSe Expressionskassette mit der Struktur SEQ ID 
NO: 32 -Promoter- SEQ ID NO: 33, SEQ ID NO: 34 oder SEQ ID NO: 35 
Nukleinsauremolekul, z.B. ein Nukleinsauremolekul mit einer Nu- 
45 kleotidsecnienz der SEQ ID N0:1 oder eines Tells davon, kann unter 
Verwendung molekularbiologischer Standardtechniken und der hier 
bereitges tell ten Sequenz information isoliert werden. Auch kann 
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mithilfe von. Vergleichsalgorithmen beispielsweise eine homologe 
Sequenz oder homologe, konservierte Sequenzbereiche auf DNA oder 
AminosSureebene identif iziert warden. Beispielsweise kann aus ei- 
ner Phaeodactylum tricomutum cDNA aus einer Phaeodactylinn tri- 
5 cornut\Jin-Bank isoliert werden^ indeiu die vollst&idige SEQ ID 
N0:1, 3, 5 Oder 11 oder ein Teil davon als Hybridisierungssonde 
sowie Standard-Hybridisierungstechniken (wie z.B. beschrieben 
in Saitibrook et al.. Molecular Cloning: A Laboratory Manual, 
2 . Auf 1 . , Cold Spring Harbor Laboratory, Cold Spring Harbor Labo- 

10 ratory Press, Cold Spring Harbor, NY, 1989) verwendet warden. 

Oberdies lasst sich ein NukleinsauremolekUl, umfassend eine voll- 
standige Sequenz der SEQ ID NO: 1, 3, 5 oder 11 oder einen Teil 
davon, durch Polymerasekettenreaktion isolieren, wobei Oligonu- 
kleotidprimer, die auf der Basis dieser Sequenz oder von Teilen 

15 davon, insbesondere Regionen um Motive aus Beispiel 5a erstellt 
werden oder Modifikationen ebensolcher in einzelnen definierten 
AminosMtiren, verwendet werden (z.B. kann ein Nukleinsauremolekul, 
xomfassend die vollstandigen Sequenz der SEQ ID N0:1, 3; 5 oder 11 
Oder einen Teil davon, durch Polymerasekettenreaktion unter Ver- 

20 wendung von Oligonukleotidprimern isoliert werden, die auf der 
Basis dieser gleichen Sequenz der SEQ ID NO: 1, 3, 5 oder 11 er- 
stellt worden sind) . Zuia Beispiel lasst sich mRNA aus Zellen iso- 
lieren (z.B. durch das Guanidiniumthiocyanat-Extraktionsverfahren 
von Chirgwin et al. (1979) Biochemistry 18:5294-5299) und cDNA 

25 mittels Reverser Transkriptase (z.B. Moloney-MLV-Reverse-Trans- 
kriptase, erhSltlich von Gibco/BRL, Bethesda, MD, oder AMV-Re- 
verse-Translcriptase, erhaltlich von Seikagaku America, Inc., 
St .Petersburg, FL) herstellen. Synthetische Oligonukleotidprimer 
zur Amplif izierung mittels Polymerasekettenreaktion lassen sich 

30 auf der Basis einer der in SEQ ID NO: 1, 3, 5 oder 11 sowie der 
in Figur 5a gezeigten Sequenzen oder mithilfe der in SEQ ID NO: 
2, 4, 6 oder 12 dargestellten Amino sauresec3Tienz en erstellen. Eine 
erf indungsgemaEe Nukleinsaure kann iinter Ve^rwendung von cDNA 
oder alternativ von genomischer DNA als Matrize und geeigneten 

35 Oligonukleotidprimern gemSS Standard~PCR-Amplif ikationstechniken 
amplif iziert werden. Die so amplif izierte Nukleinsaure kann in 
einen geeigneten Vektor kloniert werden xind mittels DNA-Sequenz- 
analyse charakterisiert werden. Oligonukleotide, die einer 
Desaturase-Nukleotidsequenz entsprechen, konnen d\irch Standard- 

40 Syntheseverfahren, beispielsweise mit einem automatischen DNA- 
Synthesegerat, hergestellt verden. 

Die in SEQ ID NO: 1,3, 5 oder 11 gezeigte cDNA umfasst Sequenzen, 
die Desaturasen kodieren, (d.h. den ''kodierenden Bereich") sowie 
45 5'-\intranslatierte Sequenzen und 3 ' -untranslatierte Sequenzen. 
Alternativ kann das NukleinsSuremolekUl nur den kodierenden 
Bereich einer der Sequenzen in SEQ ID NO: 1, 3, 5 oder 11 um- 
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fassen oder kann ganze genomische Fragmente, die aus genomischer 
DNA isoliert sind, enthalten. 

Bei einer weiteren bevorzugten Ausftihrungsf orm umfasst ein 
5 erf indungsgemaSes isoliertes Nukleinsauremolekiil ein Nuklein- 
sauremolekiil, das ein Komplement einer der in SEQ ID NO: 1, 3, 5 
Oder 11 gezeigten Nukleotidsequenzen oder eines Tails davon ist. 
Bin Nukleinsauremolekiil, das zu einer der in SEQ ID NO: 1, 3, 5 
Oder 11 gezeigten Nukleotidsequenzen kompleraentar ist, ist dann 
10 ausreichend komplementar , wenn es mit einer der in SEQ ID NO: 1, 
3, 5 Oder 11 angegebenen Sequerxzen hybridisieren kann, wodurch 
ein stabiler Duplex entsteht. 

Homologe der neuen Desaturase-Nukleinsaureseguenzen mit der 

15 Secxuenz SEQ ID NO: 1, 3, 5 oder 11 bedeutet beispielsweise 

allelische Varianten mit mindestens etwa 50 bis 60 %, vorzugs- 
weise mindestens etwa 60 bis 70 %, starker bevorzugt mindestens 
etwa 70 bis 80 %, 80 bis 90 % oder 90 bis 95 % und noch starker 
bevorzugt mindestens etwa 95 %/ 96 %, 97 %, 98 %, 99 % oder 

20 mehr Homologie zu einer in SEQ ID NO: 1, 3, 5 oder 11 gezeigten 
Nukleotidsequenzen oder ihren Homologen, Derivaten oder Analoga 
oder Teilen davon, Bei einer weiteren bevorzugten Aus fuhrungs form 
umfasst ein isoliertes erf indtingsgemafies Nukleinsauremolekul eine 
Nukleotidsequenz, die an eine der in SEQ ID NO: 1, 3, 5 oder 11 

25 gezeigten Nukleotidsequenzen oder einen Teil davon hybridisiert , 
z.B. unter stringenten Bedingungen hybridisiert. Allelische 
Varianten umfassen insbesondere funktionelle Varianten; die 
sich durch Deletion, Insertion oder Substitution von Nukleotiden 
aus/in der in SSQ ID NO: 1, 3, 5 oder 11 dargestellten Sequenz 

30 erhalten lassen, wobei aber die Absicht ist, dass die Enzym- 
aktivitat der davon herrtlhrenden synthetisierten Proteine fur 
die Insertion eines oder mehrerer Gene vorteilhaf terweise bei- 
behalten wird. Proteine, die noch die enzymatische Aktivitat der 
Desaturase besitzen, das heiSt deren Aktivitat im wesentlichen 

35 nicht reduziert ist, bedeutet Proteine mit mindestens 10 %, vor- 
zugsweise 20 %, besonders bevorzugt 30 ganz besonders bevor- 
zugt 40 % der ursprttoglichen Enzymaktivitat , verglichen mit dem 
durch SEQ ID WO: 2, 4, 6 oder 12 kodierten Protein. 

40 Homologen der SEQ ID NO: 1, 3, 5 oder 11 bedeuten beispiels- 
weise auch bakterielle, Pilz- und Pflanzenhomologen, verktirzte 
Sequenzen, einzelstrangige DNA oder RNA der kodierenden und 
nicht -kodierenden DNA-Sequenz . 

45 Homologen der SEQ ID NO: 1, 3, 5 oder 11 bedeutet auch 

Derivate, wie beispielsweise Promotorvarianten. Die Promotoren 
stromaufwarts der angegebenen Nukleotidsequenzen konnen durch 



wo 02/057464 



PCT/EP02/00461 



34 

einen oder mehrere Nukleotidaustausche; durch Insertion (en) 
und/oder Deletion (en) modifiziert werden, ohne dass jedoch die 
Funktionalitat oder AktivitSt der Promotoren gestOrt wird. Es 
ist weiterhin mSglich, dass die Aktivitat der Promotoren durch 
5 Modifikation ihxer Sequenz erhoht ist oder dass sie vollstandig 
durch aktivere Promotoren, sogar aus heterologen Organisinen, 
ersetzt werden. 

tiberdies kann das erf indungsgemSfie Nukleinsauremolekul nur 

10 einen Teil des kodierenden Bereichs einer der Sequenzen in 

SEQ ID NO: 1, 3, 5 oder 11 ximfassen, zum Beispiel ein Fragment, 
das als Sonde oder Primer verwendet werden kann, oder ein 
Fragment/ welches einen biologisch aktiven Abschnitt einer 
Desaturase kodiert. Die aus der Klonierung des Desaturase-Gens 

15 von Phaeodactylum tricomutum ennittelten Nukleotidseguenzen 

ermoglichen die Erzeugung von Sonden und Primern, die zur Identi- 
fizierung und/oder Klonierung von Desaturase-Homologen in anderen 
Zelltypen und Organismen sowie Desaturase-Homologen aus anderen 
Mikroalgen oder verwandten Arten gestaltet sind. Die Sonde/der 

20 Primer umfasst gewohnlich im wesentlichen gereinigtes Oligo- 

nukleotid. Das Oligonukleotid umfasst gewohnlich einen Nukleotid- 
secjuenzbereich, der unter stringent en Bedingungen an mindestens 
etwa 12, vorzugsweisG etwa 16, starker bevorzugt etwa 25, 40, 50 
oder 75 aufeinanderf olgende Nukleotide eines Sense-Stranges einer 

25 der in SEQ ID NO: 1, 3, 5 oder 11 angegebenen Sequenzen, eines 
Antisense-Stranges einer der in SEQ ID NO: 1, 3, 5 oder 11 an- 
gegebenen Sequenzen oder seiner Homologen, Derivate oder Analoga 
Oder naturlich vorkommender Mutanten davon hybridisiert . Primer 
auf der Basis einer Nukleotidsecjuenz der SEQ ID NO: 1, 3, 5 

30 oder 11 konnen in PCR-Reaktionen zur Klonierung von Desaturase- 
Homologen verTftTendet werden. Sonden auf der Basis der Desaturase- 
Nukleotidsequenzen konnen zum Nachweis von Transkripten oder 
genomischen Sequenzen, die das gleiche oder homologe Proteine 
kodieren, verwendet werden. Bei bevorzugten Ausftihrungsformen 

35 umfasst die Sonde zudem eine daran gebundene Markierungsgruppe, 
z.B. ein Radioisotop, eine f luoreszierende Verbindung, ein Enzym 
oder einen Enzym-Cof aktor . Diese Sonden k5nnen als Teil eines 
Test-Kits fur genomische Marker zur Identif izierung von Zellen, 
die eine Desaturase misexprimieren, beispielsweise durch Messen 

40 einer Menge einer Desaturase-kodierenden Nukleinsaure in einer 
Zellenprobe, z.B. Messen der Desaturase-mRNA-Spiegel, oder zxir 
Bestimmung, ob ein genomisches Desatiirase-Gen mutiert oder 
deletiert ist, verwendet werden. 

45 Bei einer Aus filhrungs form kodiert das erf ind\ingsgemS.£e Nixklein- 
sauremolekul ein Protein oder einen Teil davon, das/der eine 
AminoscLuresequenz umfasst, die ausreichend homolog zu einer 
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AminosSuresequenz der SEQ ID NO: 2, 4, 6 Oder 12 ist, dass das 
Protein oder der Teil davon die Fahigkeit, am Stoffwechsel von 
ziiin Aufbau von Zellmembranen in Mikroorganismen oder Pf lanzen 
notwendigen Verbindungen oder am Transport von Molekaien liber 
5 diese Membranen teilzunehmen, beibehalt. Wie hier verwendet, 
betrifft der Begriff *'ausreichend homolog" Proteine oder Teile 
davon, deren AminosSuresequenzen eine minimale Anzahl identischer 
Oder aguival enter Aminosaurereste (z.B. einen AminosSurerest 
mit einer ahnlichen Seitenkette, wie ein Aminosaurerest in 

10 einer der Sequenzen der SEQ ID NO: 2) zu einer AminosSuresequenz 
der SEQ ID NO: 2 aufweisen, so dass das Protein oder der Teil 
davon am Stoffwechsel von zum Aufbau von Zellmembranen in Mikro- 
organismen oder Pflanzen notwendigen Verbindungen oder am Trans- 
port von Molekiilen iiber diese Membranen teilnehmen kann. Protein- 

15 bestandteile dieser Stof fwechselwege ftir Membrankomponenten 
Oder Membrantransportsysteme k6nnen, wie hier beschrieben, 
eine Rolle bei der Produktion und Sekretion einer oder mehrerer 
Feinchemikalien spielen. Beispiele fiir diese Aktivitaten sind 
hier ebenfalls beschrieben. Somit tragt die "Funktion einer 

20 Desaturase" entweder direkt oder indirekt zur Ausbeute, Pro- 
duktion und/oder Effizienz der Produktion einer oder mehrerer 
feinchemikalien bei, Beispiele ftir Desaturase-Substratspezifi- 
taten der katalytischen Aktivitat sind in Tabelle 5 imd 6 
angegeben . 

25 

Bei einer weiteren Ausfiihrungsf orm kodieren Derivate des 
erf indungsgemaiSen Nukleinsauremolektils Proteine mit mindestens 
etwa 50 bis 60 %, vorzugsweise mindestens etwa 60 bis 70 % ymd 
starker bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 

30 -90 bis 95 % und am starksten bevorzugt mindestens etwa 96 %, 
97 %, 98 %/ 99 % oder mehr Homologie zu einer vollstandigen 
Aminosauresequenz der SEQ ID K0:2. Die Homologie der Aminosaure- 
sequenz kann liber den gesamten Sequenzbereich mit dem Programm 
PileUp (J. Mol. Evolution., 25, 351-360, 1987, Higgins et al., 

35 CABIOS, 5, 1989:151-153) oder BESTFIT oder GAP bestimmt 

(Henikoff, S. and Henikoff, J, G. (1992), Amino acid substitution 
matrices from protein blocks- Proc. Natl. Acad, Sci. USA 89: 
10915-10919.) 

40 Teile von Proteinen, die von den erf indungsgemafien Desaturase- 
Nukleinsauremolekulen kodiert werden, sind vorzugsweise bio- 
logisch aktive Teile einer der Desaturasen. Wie hier verwendet, 
soil der Begriff "biologisch aktiver Teil einer Desaturase" , 
einen Abschnitt, z.B. eine Domane/ein Motiv, einer Desaturase 

45 umfassen, der am Stoffwechsel von zum Aufbau von Zellmembranen 
in Mikroorganismen oder Pflanzen notwendigen Verbindungen oder 
am Transport von Molekulen tlber diese Membranen teilnehmen kann 
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Oder eine in Tabelle 5 und 6 angegebene Aktivitat aufweist. Zur 
Bestiiranung, ob eine Desaturase Oder ein biologisch aktiver Teil 
davon am Stof fwechsel von zum Aufbau von Zellmembranen in Mikro- 
organismen oder Pflanzen notwendigen Verbindungen oder am Trans- 
5 port von- Mole3caien Ober diese Membranen teilnehitien kann, kann 
ein Test der enzymatischen Aktivitat durchgefuhrt warden. Diese 
Testverfahren, wie eingehend in Beispiel 8 des Beispielteils 
beschrieben, sind dem Fachmann geiaufig. 

10 Zusatzliche Nukleinsaurefragmente, die biologisch aktive 
Abschnitte einer Desaturase kodieren, lassen sich durch 
Isolierung eines Tails einer der Sequenzen in SEQ ID NO: 1, 3, 
5 Oder 11, Expriinieren des kodierten Abschnitt der Desaturase 
oder des Peptids (z.B. durch rekombinante Expression in vitro) 

15 vnd Bestimmen der Aktivitat des kodierten Teils der Desaturase 
Oder des Peptids herstellen. 

Die Erfindung umfasst zudem Nukleinsauremolekule, die sich 

von einer der in SEQ ID NO: 1, 3, 5 oder 11 gezeigten Nukleotid- 

20 sequenzen (und Teilen davon) aufgrund des degenerierten 

genetischen Codes \mterscheiden und soiciit die gleiche Desaturase 
kodieren wie diejenige, die von den in SEQ ID NO: 1, 3, 5 oder 11 
gezeigten Nukleotidsequenzen kodiert wird. Bei einer anderen Aus- 
fuhrungsform hat ein erf indungsgeinaSes isoliertes Nukleinsaure- 

25 molekiil eine Nukleotidseguenz, die fiir ein Protein mit einer in 
SEQ ID J^O: 2, 4, 6 oder 12 gezeigten AminosSuresequenz kodiert. 
Bei einer weiteren Ausfuhrungsform kodiert das erf indungsgemafie 
Nukleinsauremolekiil ein Vollangen-Desaturase-Protein, das zu 
einer Aminosauresequenz der SEQ ID NO: 2,4, 6 oder 12 (die 

30 von einem in SEQ ID NO: 1, 3, 5' oder 11 gezeigten offenen 

Leseraster kodiert wird) im wesentlichen homolog ist und durch 
gSngige Methoden identif izierbar und isolierbar ist. 

Zusatzlich zu den in SEQ ID NO: 1, 3, 5 oder 11 gezeigten 
35 Desaturase-Nukleotidsequenzen erkennt der Fachmann, dass DNA- 
Sequenzpolymorphlsmen,v^ die zu Anderungen in den Aminosaure- 
sequenzen der Desaturasen fiihren, innerhalb einer Population 
(z.B. der Phaeodactylum tricornutum- Population) existieren 
konnen. Diese genetischen Polyinorphisnien im Desaturase-Gen konnen 
40 zwischen Individuen innerhalb einer Population aufgrund von 
natUrlicher Variation existieren. Wie hier verwendet, bedeuten 
die Begriffe "Gen" vind "rekombinantes Gen" Nukleinsauremolekule 
mit einem offenen Leserahmen, der eine Desaturase, vorzugsweise 
eine Phaeodactyl\am tricornutum -Desaturase, kodiert. Diese natilr- 
45 lichen Varianten bewirken (iblicherweise eine Varianz von 1 bis 
5 % in der Nukleotidsequenz des Desaturase-Gens . Samtliche 
\ind alle dieser Nukleotidvariationen und deiraus resultierende 
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Atainosaurepolyraorphismen in der Desaturase, die das Ergebnis 
natdrlicher Variation sind und die funktionelle Aktivitat von 
Desaturasen nicht verandem, sollen im Umfang der Erf indung 
enthalten sein. 

5 

Nukleinsauremolekaie, die den naturlichen Varicinten entsprechen, 
und nicht -Phaeodactylum tricornutum-Homologen, -Derivate und 
-Analoga der Phaeodactyliim tricornutum-cDNA kSnnen auf der 
Grundlage ihrer Homologie zu der hier of fenbarten Phaeodactylum 

10 tricornutum-Eesaturase-NukleinsSure unter Verwendiing der Phaeo- 
dactyliim tricomutum-cDNA oder eines Teils davon als Hybridi- 
sierungssonde gexnaS Standard-Hybridisierungstechniken unter 
stringenten Hybridisierungsbedingungen isoliert werden. Bei einer 
anderen Ausfuhrungsform ist ein erfindungsgema&es isoliertes 

15 NukleinsSLuremolekQl mindestens 15 Nukleotide lang und hybridi- 
siert unter stringenten Bedingimgen mit dem Nukleinsauremolekiil, 
das eine Nukleotidsequenz der SEQ ID NO: 1/ 3, 5 oder 11 umfasst. 
Bei anderen Ausftihnmgsformen ist die NukleinsSure mindestens 25, 
50, 100, 250 Oder mehr Nukleotide lang. Der Begriff "hybridisiert 

20 unter stringenten Bedingungen" , wie hier verwendet, soil Hybridi- 
sierungs- und Waschbedingungen beschreiben, unter denen Nukleo- 
tidsequenzen, die mindestens 60 % homolog zueinander sind, ge- 
w6hnlich aneinander hybridisiert bleiben. Die Bedingungen sind 
vorzugsweise derart, dass Sequenzen, die mindestens etwa 65 %, 

25 starker bevorzugt mindestens etwa 70 % und noch starker bevor- 
zugt mindestens etwa 75 % oder starker zueinander homolog sind, 
gewohnlich aneinander hybridisiert bleiben.. Diese stringenten 
Bedingungen sind dem Fachmann bekannt und lassen sich in Current 
Protocols in Molecular Biology, John Wiley & Sons, N. Y. (1989), 

30 6.3.1-6.3.6., finden. Ein bevorzugtes, nicht einschrankendes 

Beispiel fur stringente Hybridisierungsbedingungen sind Hybridi- 
sienangen in 6 x Natriumchlorid/Natriumcitrat (sodium chloride/ 
sodiumcitrate = SSC) bei etwa 45**C, gefolgt von einem oder 
mehreren Waschschritten in 0,2 x SSC, 0,1 % SDS bei 50 bis 55°C. . 

35 Dem Fachmann ist bekannt, dass diese Hybridisierungsbedingxmgen 
sich je nach dem Typ der NukleinsSure und, wenn beispielsweise 
organische L5sungsmittel vorliegen, hinsichtlich der Temperatur 
\md der Konzentration des Puffers unterscheiden. Die Temperatur 
unterscheidet sich beispielsweise unter "Standard-Hybridi- 

40 sierungsbedingungen" je nach dem Typ der NukleinsSure zwischen 
42°C und 58°C in wSssrigem Puffer mit einer Konzentration von 0,1 
bis 5 X SSC (pH 7,2). Falls drganisches Losungsmittel im oben- 
genannten Puffer vorliegt, zum Beispiel 50 % Formamid, ist die 
Temperatur unter Standardbedingungen etwa 42°C. Vorzugsweise sind 

45 die Hybridisierungsbedingungen fUr DNArDNA-Hybride zum Beispiel 
0,1 X SSC und 20**C bis 45°C, vorzugsweise zwischen 30'*C und 45®C. 
Vorzugsweise sind die Hybridisierungsbedingxmgen ftir DNA:RNA- 
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Hybride ziim Beispiel 0,1 x SSC und 30°C bis 55°C, vorzugsweise 
zwischen 45^0 und SS'^C. Die vorstehend genannten Hybridisierungs- 
temperaturen sind beispielsweise filr eine Nukleinsaure mit etwa 
100 bp (= Basenpaare) Lange und einem G + C-Gehalt von 50 % 
5 in Abwesenheit von Formamid bestiinmt. Der Fachmarm weiS, wie 
die erf order lichen Hybridisierimgsbedingungen anhand von Lehr- 
biichem, wie dem vorstehend erwahnten oder aus den folgenden 
Lehrbuchern Sainbrook et al., "Molecular Cloning", Cold Spring 
Harbor Laboratory, 1989; Hames tmd Higgins (Hrsgb.) 1985, 
10 "Nucleic Acids Hybridization: A Practical Approach", IRL Press at 
Oxford University Press, Oxford; Brovmi (Hrsgb.) 1991, "Essential 
Molecular Biology: A Practical Approach", IRL Press at Oxford 
University Press, Oxford, bestiicmit werden kdnnen. 

15 Vorzugsweise entspricht ein erf indungsgemaiSes isoliertes Nuklein- 
saureitiolekul, das unter stringenten Bedingungen an eine Sequenz 
der SEQ ID N0:1, 3, 5 Oder 11 hybridisiert , einem natiirlich vor- 
koinmenden Nukleinsauremolekul . Wie hier verwendet, betrifft ein 
"natiirlich vorkommendes." Nukleinsauremolektll ein RNA- oder UNA- 

20 Molekiil mit einer Nukleotidsequenz , die in der Natur vorkoinint 

(z.B. ein nattirliches Protein kodiert) . Bei einer Aus fiihrungs form 
kodiert die Nukleinsaure eine natur liche vorkoimtiendes Phyaeo- 
dactyliam tricomut\na-Desaturase . 

25 Zusatzlich zu natiirlich vorkoiranenden Varianten der Desaturase- 
sequenz, die in der Population existieren kdnnen, erkennt der 
Fachmann ferner, dass auch Anderungen durch Mutation in eine 
Nukleotidsequenz der SEQ ID NO: 1, 3, 5 oder 11 eingebracht 
werden konnen, was zu Anderungen der Aminosaure sequenz der 

30 kodierten Desaturase fiihrt, ohne dass die FunktionsfMhigkeit 
des Desaturaseproteins beeintrachtigt wird. Beispielsweise 
lassen sich Nukleotidsusbtitutionen, die an "nicht-essentiellen" 
Aminos^ureresten zu Aminos auresubsti tut ionen fiihren, in einer 
Sequenz der SEQ ID NO; 2, 4, 6 oder 12 herstellen. Ein "nicht- 

35 essentieller" Aitiinosaurerest ist ein Rest, der sich in einer 

Wildtyp-Desaturasequenz einer der Desaturasen (SEQ ID NO: 2, 4, 6 
Oder 12) verandem lasst, ohne dass die Aktivitat der Desaturase 
verSndert das heiSt wesentlich reduziert wird, wohingegen ein 
"essentieller" AminosSurerest fiir die Desaturaseaktivitat 

40 erforderlich ist. Andere Aminosaurereste (z.B. diejenigen, die 
in der Dom&ie mit Desaturaseaktivitat nicht konserviert oder 
lediglich semikonserviert sind) k5nnen jedoch fUr die Aktivitat 
nicht essentiell sein und lassen sich somit verandem, ohne dass 
die Desaturaseaktivitat verandert wird. 
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Folglich betrif ft ein weiterer Aspekt der Erfindung Nuklein- 
sSuremolektUe, die Desaturasen kodieren, die veranderte Amino- 
sSurereste enthalten, die far die Desaturaseaktivitat nicht 
essentiell sind. Diese Desaturasen \interscheiden sich in der 
5 Aminosauresequenz von einer Seguenz in SEQ ID NO: 2, 4, 6 oder 
12 und behalten dennoch zuiaindest eine der hier beschriebenen 
Desaturaseaktivitaten. Das isolierte Nukleinsauremolekttl uitifasst 
bei einer Ausfuhrungsf orm eine Nukleotidsequenz , die ein Protein 
kodiert/ wobei das Protein eine Aminosauresequenz mit mindestens 

10 etwa 50 % Homologie zu einer Aminosauresequenz der SEQ ID NO: 2, 
4, 6 Oder 12 umfasst und am Stoffwechsel von zum Aufbau von Zell- 
membranen in Phaeodactylxxcn tricornutum notwendigen Verbindungen 
Oder am Transport von Mole3culen uber diese Membranen teilnehmen 
kann. Das von dem Nukleinsauremolekul kodierte Protein ist 

15 vorzugsweise mindestens etwa 50 bis 60 % homolog zu einer der 
Sequenzen in SEQ ID NO: 2, 4, 6 oder 12 starker bevorzugt min- 
destens etwa 60 bis 70 % homolog zu einer der Sequenzen in 
SEQ ID NO: 2, 4, 6 oder 12 noch stSrker bevorzugt mindestens 
etwa 70 bis 80 %, 80 bis 90 %; 90 bis 95 % homolog zu einer 

20 der Sequenzen in SEQ ID NO: 2, 4, 6 oder 12 und am starksten 
bevorzugt mindestens etwa 96 97 %, 98 % oder 99 % homolog 
zu einer der Sequenzen in SEQ ID NO: 2, 4, 6 oder 12. 

Zur Bestimmung der prozentualen Homologie von zwei Aminosaure- 

25 sequenzen (z.B. einer der Sequenzen der SEQ ID NO: 2, 4, 6 oder 
12 und einer mutierten Form davon) oder von zwei NukleinsSuren 
werden die Sequenzen zxim Zweck des optimalen Vergleichs xmter- 
einander geschrieben (z.B. konnen Lucken in die Sequenz eines 
Proteins oder einer Nukleinsaure eingefugt werden, urn ein opti- 

30 males Alignment mit dem anderen Protein oder der anderen Nuklein- 
sSvire zu erzeugen) . Die AminosS-urereste oder Nukleotide an den 
entsprechenden Amino sMurepositionen oder Nukleotidpositionen 
werden dann verglichen. Wenn eine Position in einer Seguenz (z.B. 
einer der Sequenzen der SEQ ID NO: 2, 4, 6 oder 12) durch den 

35 gleichen AminosSurerest oder das gleiche Nukleotid wie die ent- 
sprechende Stelle in der anderen Sequenz (z.B. einer mutierten 
Form der aus SEQ ID NO: 2, 4, 6 oder 12 ausgewShlten Sequenz) 
belegt wird, dann sind die MolekQle an dieser Position homolog 
(d.h. Aminosaure- oder Nukleinsaure- "Homologie " , wis hier ver- 

40 wendet, entspricht Aminosaure- oder Nukleinsaure- " Identitat ") . 
Die prozentuale Homologie zwischen den beiden Sequenzen ist 
eine Funktion der Anzahl an identischen Positionen, die den 
Sequenzen gemeinsam sind (d.h. % Homologie = Anzahl der 
identischen Positionen/Gesamtanzahl der Positionen x 100) . 

45 Die Begriffe Homologie xmd Identitat sind damit als Synonym 
anzusehen. 
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Ein isoliertes Nukleins^uremolekul, das eine Desaturase kodiert, 
die zu einer Proteins equenz der SEQ ID NO: 2, 4, 6 Oder 12 homo- 
log ist, kann durch Einbringen einer oder mehrerer Nukleotid- 
siibstitutionen, -additionen oder -deletionen in eine Nukleotid- 
5 sequenz der SEQ ID NO: 1, 3, 5 oder 11 erzeugt werden, so 
dass eine oder mehrere AminoB^uresubstitutionen, -additionen 
Oder -deletionen in das kodierte Protein eingebracht werden. 
Mutationen konnen in eine der Sequenzen der SEQ ID NO: 1, 3, 5 
Oder 11 durch Standardtechniken, wie stellenspezif ische Muta- 

10 genese uad PCR-vermittelte Mutagenese, eingebracht werden. 
Vorzugsweise werden konservative AminosSuresubstitutionen an 
einer oder mehreren der vorhergesagten nicht-essentiellen Aiaino- 
saureresten hergestellt. Bei einer "konseirvativen Aininosaure- 
siibstitution" wird der AminosSiirerest gegen einen Airlnos Surer est 

15 niit einer Shnlichen Seitenkette ausgetauscht . Im Fachgebiet 
sind Faiailien von Aminos aureres ten mit ahnlichen Seitenketten 
definiert worden. Diese Familien umfassen Aininosauren mit 
basischen Seitenketten (z.B. Lysin, Arginin, Histidin) , sauren 
Seitenketten (z.B. Asparaginsaure, Glutaminsaure) , ^jngeladenen 

20 polaren Seitenketten [z.B, Glycin, Asparagin, Glutamin, Serin, 
Threonin, Tyrosin, Cystein) , unpolaren Seitenketten, (z.B. 
Alanin, Valin, Leucin, Isoleucin, Prolin, Phenylalanin, 
Methionin, Tryptophan), beta-verzweigten Seitenketten (z.B, 
Threonin, Valin, Isoleucin) und aromatischen Seitenketten (z.B. 

25 Tyrosin, Phenylalanin, Tryptophan, Histidin) . Ein vorhergesagter 
nicht-easentieller Aminosaurerest in einer Desaturase wird somit 
vorzugsweise durch einen anderen Aminosaurerest aus der gleichen 
Seitenkettenfamilie ausgetauscht. Altemativ konnen bei einer 
anderen Aus fuhrungs form die Mutationen zufallsgemafi uber die 

30 gesamte oder einen Teil der Desaturase-kodierenden Sequenz ein- 
gebracht werden; z.B. durch Sattigungsmutagenese , und die resul- 
tierenden Mutanten konnen nach der hier beschriebenen Desaturase- 
Aktivitat durchmustert werden, urn Mutanten zu identifizieren, 
die DesaturaseaktiviteLt beibehalten. Nach der Mutagenese einer 

35 der Sequenzen der SEQ ID NO: 1, 3, 5 oder 11 kann das kodierte 
Protein rekombinant exprimiert werden, und die Aktivitat des 
Proteins kann z.B. unter Verwendung der hier beschriebenen Tests 
(siehe Beispielteil) bestintmt werden. 

40 Zus^tzlich zu den Nukleinsa.uremolekUlen, welche die vorstehend 
beschriebenen Desaturasen kodieren, betrifft ein weiterer Aspekt 
der Erfindung isolierte Nukleinsauremolekttle, die "Antisense" 
zu den erf indungsgeraaSen Nukle ins axires equenz en sind. Eine "Anti- 
sense ''-NukleinsSure umfasst eine Nukleotidsequenz, die zu einer 

45 "Sense^-NukleinsSLure, welche ein Protein kodiert, komplementar 
ist, z.B. koinplementar zum kodierenden Strang eines doppel- 
etrangigen cDWA-MolekUls oder konplementfir zu einer mRNA-Sequenz . 
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Eine Antisense-Nukleinsaure kann folglich iiber Wasserstoff- 
briickenbindungen an eine Sense-Nukleinsaure binden. Die Anti- 
sense-Nukleins^ure kann zu einem gesamten Desaturase-kodierenden 
Strang oder nur zu einem Teil davon komplementar sein. Bei einer 
5 Ausftihrungsform ist ein Ant i sens e-NukleinsauremolekuI "Antisense" 
zu einem "kodierenden Bereich** des kodierenden Strangs einer 
Nukleotidsequenz, die eine Desaturase kodiert. Der Begriff 
"kodierender Bereich'' betrifft den Bereich der Nukleotidsequenz, 
der Codons umfasst, die in Aminosaurereste translatiert werden 

10 (z.B. den gesamten kodierenden Bereich, der mit deia Stopcodon 
beginnt una endet, d,h. dem letzten Codon vor dem Stopcodon) . 
Bei einer weiteren Ausftihrungsform ist das Antisense-Nuklein- 
sauremolekiil "Antisense" zu einem "nicht-kodierenden Bereich" 
des kodierenden Strangs einer Nukleotidsequenz, die Desaturase 

15 kodiert. Der Begriff 'nicht-kodierender Bereich' betrifft 5'- 
\and 3 ' -Sequenzen, die den kodierenden Bereich flankieren und 
nicht in Aminosauren translatiert werden (d.h, die man auch 
als 5'- und 3 '-xintranslatierte Bereiche bezeichnet) . 

20 Unter Voraussetzung der hier offenbarten Desaturase-kodierenden 
Sequenzen des kodierenden Stranges (z.B. die in SEQ ID NO: 1, 
3, 5 Oder 11 dargestellten Sequenzen) kannen erfind^lngsgema£e 
Antisense-NukleinsSuren geinafi den Regeln der Watson-Crick-Basen- 
paarung gestaltet werden. Das Antisense-Nukleinsauremolekiil kann 

25 komplementar zum gesamten kodierenden Bereich von Desaturase-mRNA 
sein, ist aber starker bevorzugt ein Oligonukleotid, das nur zu 
einem Teil des kodierenden oder nicht-kodierenden Bereichs von 
Desaturase-mRNA "Antisense" ist. Das Antisense-Oligomakleotid 
kann z.B, zu dem Bereich, der die Translationsstartstelle von 

30 Desat\arase-mRNA umgibt, komplementar sein. Ein Antisense-Oligo- 
nukleotid kann z.B. etwa 5, 10, 15, 20, 25, 30, 35, 40, 45 oder 
50 und mehr Nukleotide lang sein. Eine erf indungsgemaiSe Anti- 
sense-Nukleinsaure kann unter Verwendung chemischer Synthese xmd 
enzymatischer Ligationsreaktionen mittels im Fachgebiet bekannter 

35 Verfahren konstruiert werden. Eine Antisense-Nukleinsaure (z.B. 
ein Antisense-Oligonukleotid) kann z.B. chemisch synthetisiert 
werden, wobei natUrlich vorkommende Nukleotide oder verschiedent- 
lich modifizierte Nukleotide verwendet werden, die so gestaltet 
sind, dass sie die biologische Stabilitat der Molekule erhohen 

40 Oder die physikalische Stabilitat des zwischen der Antisense- und 
der Sense-Nukleinsa\ire gebildeten Duplexes erhdJhen, beispiels- 
weise kdnnen Phosphorthioat-Derivate und acridinsubstituierte 
Nukleotide verwendet werden, Beispiele fiir modifizierte Nukleo- 
tide, die zur Erzeugiing der Antisense-Nukleinsaure verwendet 

45 werden kSnnen, sind u.a. 5-Fluoruracil , 5-Bromuracil, 5-Chlor- 
uracil, 5-Ioduracil, Hypoxanthin, Xanthin, 4-Acetylcytosin, 
5- (Carboxyhydroxylmethyl ) uracil , 5-Carboxymethylaiiiinomethyl-2- 
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thiouridin , S-Carboxymethylaminomethyluracil , Dihydrouracil , 
Beta-D-Galactosylqueosin, Inosin, N6-Isopentenyladenin, 1-Methyl- 
guanin, 1-Methylinosin, 2,2-Dimethylguanin, 2-Methyladenin, 
• 2-Methylguanin, 3-Methylcytosin, 5-Methylcytosin, N6-Adenin, 
5 7-Methylguanin, S-Methylaminometliyluracil, 5-Methoxyaininomethyl- 
2-thiouracil, Beta-D-Mannosylqueosin, 5 ' -Methoxycarboxymethyl- 
uracil, 5-Methoxyuracili 2-Methylthio-N6-isopentyladenin, Uracil- 
5-oxyessigsaure (v) , Wybutoxosin^ Desaturaseudouracil, Queosin, 
2-Thiocytosin, 5-Methyl-2-thiouracil, 2-Thiouracil, 4-Thiouracil, 

10 5-Methyiuracil, Uracil-S-oxyessigsauremethylester , Uracil-5- 
oxyessigsS-ure (v) , 5-Methyl-2-thiouracil , 3- (3-A3nino-3-N-2- 
carboxypropyl)uracil, (acp3)w und 2 , 6-Diaminopurin. Die Anti- 
sense-Nukleinsaure kann alternativ biologisch unter Verwendimg 
eines Express ionsvektors hergestellt werden, in den eine Nuklein- 

15 saure in Antisense-Richtung subkloniert worden ist (d.h. RNA, 
die von der eingebrachten Nukleinsaure transkribiert wird, ist 
zu einer Zielnukleinsaure von Interesse in Antisense-Richtung 
orientiert, was im nachstehenden Unterabschnitt waiter 
beschrieben ist) . 

20 Die erf indungsgemafien Antisense-Nukleinsauremolekule werden 

ublicheirweise an eine Zelle verabreicht Oder in situ erzeugt, so 
dass sie mit der zellularen itiRNA und/oder der genomischen DNA, 
die eine Desaturase kodiert, hybridisieren oder daran binden, 
uiti dadurch die Expression des Proteins, z.B. durch Hemmung der 

25 Translcription und/oder Translation, zu heinmen. Die Hybridisierung 
kann durch herkdiranliche Nukleotidkomplementaritat unter Bildung 
eines stabilen Duplexes oder z.B. im Fall eines Antisense- 
Nukleinsauremolekuls, das DNA-Duplices bindet, durch spezifische 
Wechselwirkungen in der groSen Furche der Doppelhelix erfolgen. . 

30 Das Antisense-Molektll ksum so modif iziert sein, dass es spezi- 
fisch an einen Rezeptor oder an ein auf einer ausgewahlten Zell- 
oberflache exprimiertes Antigen bindet, z.B. durch Binden des 
Antisense-Nukleinsauremolekuls an ein Peptid oder einen Anti- 
korper, das/der an einen Zelloberflachenrezeptor oder ein Antigen 

35 bindet. Das Antisense-Nukleinsauremolekul kann auch unter Ver- 
wendung der hier beschriebenen Vektoren den Zellen zugefiihrt 
werden. Zur Erzielung ausreichender intrazellulSrer Konzentra- 
tionen der Antisense-MolekUle sind Vektorkonstrukte, in denen 
sich das Antisense-Nukleinsauremolek^l unter der Kontrolle eines 

40 starken prokaryotischen, viralen oder eukaryotischen, einschliefi- 
lich pflanzlichen, Promotors befindet, bevorzugt. 

Bei einer weiteren Ausfiihrungsform ist das erf indungsgemaSe Anti- 
sense-Nukleinsauremolekiil ein a-anomeres NukleinsSuremolektil . Ein 
45 a-anomeres NukleinsauremolekUl bildet spezifische doppelstrangige 
Hybride mit komplementarer RNA, wobei die Strange im Gegensatz zu 
gewohnlichen |J-Einheiten parallel zueinander verlaufen. (Gaultier 
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et al. (1987) Nucleic Acids Res. 15:6625-6641). Das Antisense- 
Nukleinsauremolekul kann zudeiti ein 2'-o-Methylribonukleotid 
(Inoue et al. (1987) Nucleic Acids Res. 15:6131-6148) oder 
ein chim^res RNA-DNA-Analogon (Inoue et al. (1987) FEES Lett. 
S 215:327-330) umfassen. 

Bei einer weiteren Ausfiihrungsform ist eine erfindungsgemafie 
Antisense-Nukleinsaure ein Ribozym. Ribozyme sind katalytische 
RNA-Molekiile mit RibonukleaseaktivitSt , die eine einzelstrangige 

10 NukleinsSure, wie eine mRNA, spalten kSnnen, 2u der sie einen 
komplementaren Bereich haben. Somit kSnnen Ribozyme (z.B. Hammer- 
head-Ribozyme (beschrieben in Haselhoff and Gerlach (1988) Nature 
334:585-591)) zur katalytischen Spaltung von Desaturase-iiiRNA- 
Transkripten verT^rendet werden, urn dadurch die Translation von 

15 Desaturase-mRNA 2U hemmen. Ein Ribozym mit Spezifitat ftir eine 
Desaturase-kodierende Nukleinsaure kann auf der Basis der Nukleo- 

. - tidsequenz einer der in SEQ ID NO: 1, 3, 5 oder 11 ' of f enbarten 
besaturase-cDNA (d.h. oder auf der Basis einer gemafi den in 
dieser Erfindung gelehrten Verfahren zu isolierenden heterologen 

20 Se<iuenz gestaltet werden. Beispielsweise kann ein Deri vat einer 
Tetrahymena-L-19-IVS-RNA konstruiert werden, wobei die Nxikleotid- 
sequenz der aktiven Stelle komplementar zu der KUkleotidsequenz 
ist, die in einer Desaturase-kodierenden mRNA gespalten werden 
soil. Siehe z.B. Cech et al., US-Patent Nr. 4,987,071 und Cech 

25 et al., US-Patent Nr. 5,116,742. Alternativ kann Desaturase-mRNA 
zur Selektion einer katalytischen RNA mit einer spezifischen 
Ribonukleaseaktivitat aus einem Pool von RNA-Molekulen verwendet 
werden. Siehe z.B» Bartel, D,, und Szostak, J.W. (1993) Science 
261:1411-1418. 

30 

Alternativ lasst sich die Desaturase-Gen-Expression heramen, 
indem Nukleotidseguenzen, die komplementar zum regulator ischen 
Bereich einer Desaturase-Nuklectidseguenz (z.B. einem Desaturase- 
Promotor und/oder -Enhancer) sind, so dirigiert werden, dass 
35 Dreifachhelix-Strukturen gebildet werden, welche die Transkrip- 
tion eines Desaturase-Gens in Zielzellen hemmen. Siehe allgemein 
Helene, C. (1991) Anticancer Drug Res. 6(6) 569-84; Helene, C, 
et al. (1992) Ann. N. Y. Acad. Sci. 660:27-36; und Maher. L.J. 
(1992) Bioassaya 14(12) :807-815. 

40 

B. Genkonstrukt (= Nukleinsaurekonstrukt, -fragment oder 
Expressionskassette) 

Unter der erf indungsgemafien Expressionskassette sind die in 
45 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 11 

genannten Sequenzen, die sich als Ergebnis des genetischen Codes 
und/oder deren funktionellen oder nicht funktionellen Derivate 
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zu verstehen, die mit einem oder mehreren Regulationssignalen 
vorteilhafterweise zur Erhohung der Genexpression funktionell 
verknUpf t wurden und welche vorteilhaft die E:^ression der codie- 
renden Sequenz in der Wirtszelle steuern. Diese regulatorischen 
5 Sequenzen sollen die gezielte Expression der Gene und der 

Proteinexpression ermoglichen. Dies kann beispielsweise je nach 
Wirtsorganismus bedeuten, dass das Gen erst nach Induktion 
exprimiert und/oder uberexpriitiiert wird, oder dass es sofort 
exprimiert und/oder tiberexprimiert wird. Beispielsweise handelt 

10 es sich bei diesen regulatorischen Sequenzen urn Sequenzen an 
die Induktoren oder Repressoren binden und so die Expression der 
NukleinsSure regulierea. Zusatzlich zu diesen neuen Regulations- 
sequenzen oder anstelle dieser Sequenzen kann die naturliche 
Reguilation dieser Sequenzen vor den eigentlichen Strukturgenen 

15 noch vorhanden sein und gegebenenfalls genetisch verandert worden 
sein; so dass die naturliche Regulation ausgeschaltet und die 
Expression der Gene erhdht vmrde. Das Genkonstrukt kann aber 
auch einfacher aufgebaut sein, das heifit es wurden keine zusStz- 
lichen Regulationssignale vor die Nukleinsauresequenz oder 

20 dessen Derivate inseriert und der nat^irliche Promotor mit seiner 
Regulation wurde nicht entfernt. Stattdessen wurde die naturliche 
Regulationssequenz so mutiert, dass keine Regulation mehr erfolgt 
und/oder die Genexpression gesteigert wird. Diese verSnderten 
Promotoren kCnnen in Form von Teilsequenzen (= Promotor mit 

25 Teilen der erfindungsgeitiaEen Nukleinsauresequenzen) auch allein 
vor das natUrliche Gen zur Steigertmg der AktivitUt gebracht 
werden. Das Genkonstrukt kann auHerdem vorteilhafterweise auch 
eine oder mehrere sogenannte enhancer Sequenzen^ funktionell 
verkniipft mit dem Promotor enthalten, die eine erhohte Expression 

30 der NukleinsSLuresequenz enn5glichen. Auch am 3'-Ende der DNA- 
Sequenzen kttnnen zusatzliche vorteilhafte Sequenzen inseriert 
werden wie weitere regulatorische Elemente oder Terminatoren . 
Die A-5"Desaturase-/A-6-Desaturase und/oder A-12-Desaturasegene 
konnen in einer oder mehreren Kopien in der Expressionskassette 

35 (= Genkonstrukt) enthalten sein. 

Die regulatorischen Sequenzen bz\^7. Faktoren kSnnen dabei wie 
oben beschrieben vorzugsweise die Genexpression der eingeflLhrten 
Gene posit iv beeinflussen und dadurch erhohen. So kann eine Ver- 
40 starkung der regulatorischen Elemente vorteilhafterweise auf der 
Transkriptionsebene erfolgen, indem starke Transkriptionssignale 
wie Promotoren und/oder "Enhancer" verwendet werden. Daneben ist 
aber auch eine Verstarkung der 'Translation mSglich, indem bei- 
spielsweise die Stabilitat der mRNA verbessert wird. 

45 
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Eine weitere Ausfiihrungsfonn der Erfindung sind ein oder mehrere 
Genkonstrukte, die eine oder mehrere Sequenzen enthalten, die 
durch Seq ID NO: 1, 3, 5, 1, 9 oder 11 definiert sind und gem. 
SEQ ID NO: 2, 4, 6, 8, 10 oder 12 Polypeptide kodieren. Dabei 
5 staramen SEQ ID NO: 1, 3, 5, 7 und 11 von Desaturasen wahrend 
SEQ ID NO; 9 ftir eine Elongase codiert. Desaturasen codierende 
Enzyme, die eine Doppelbindung in oder A-12 -Position 

einfiihren, wobei das Substrat ein, zwei, drei oder vier Doppel- 
bindungen aufweisen. Die in SEQ ID NO: 9 dargestellte Sequenz 

10 codiert ftir eine Enzyinaktivitat , die eine Fettsaure um min- 
destens zwei Kohlenstof fatome verlangert sowie ihre Homologen, 
Derivate oder Analoga, die funktionsf ahig mit einem oder 
mehreren Regulationssignalen, vorteilhaf terweise zur Steigerung 
der Genexpression/ verbxinden sind. Beispiele fUr diese Regula- 

15 tionssequenzen sind Sequenzen, an die Induktoren oder Repressoren 
binden und so die Expression der Nukleinsaure regulieren. Zusatz- 
lich zu diesen neuen Regulationssequenzen kann die naturliciie 
Regulation dieser Sequenzen vor den eigentlichen Strukturgenen 
noch vorhanden sein und, wenn geeignet, genetisch modifiziert 

20 worden sein, so dass die naturliche Regulation ausgeschaltet 
worden ist und die Expression der Gene gesteigert worden ist. 
Dae Genkonstrukt kann jedoch auch eine einfachere Struktur haben, 
d.h. dass keine zusatzlichen Regulationssignale vor der Sequenz 
SEQ ID NO: 1, 3, 5 oder 11 oder ihren Homologen inseriert worden 

25 sind und der naturliche Promotor mit seiner Regulation nicht 
deletiert worden ist. Statt dessen ist die natiirliche Regula- 
tionssequenz so mutiert worden, dass keine Regulation mehr statt- 
findet und die Genexpression verstarkt ist. Das Genkonstrukt 
kann auSerdem vorteilhaf terweise eine oder mehrere sogenannte 

30 Enhancer-Sequenzen, die funktionsf Mhig mit dem Promotor verbxinden 
sind und die gesteigerte Expression der Nukleinsauresequenz 
ermoglichen, \amfassen. Es ist auch moglich, am 3'-Ende der DNA- 
Sequenzen zusStzlich vorteilhafte Sequenzen zu inserieren, bei- 
spielsweise weitere Regulations elemente oder Terminatoren . Die 

35 Desaturasegene und das Elongasegen konnen im Genkonstrukt in 
einer oder melireren Kopien vorliegen. Sie konnen in einem 
Genkonstrukt oder mehreren Genkonstrukt en vorliegen. Dieses 
Genkonstrukt oder die Genkonstrukte kSnnen zusammen im Wirts- 
organismus exprimiert werden. Dabei kann das Genkonstrukt oder 

40 die Genkonstrukte in einem oder mehreren Vektoren inseriert sein 
und frei in der Zelle vorliegen oder aber im Genom inseriert 
sein. Es ist vorteilhaf t fOr die Insertion weiterer Gene in 
Organismen, wenn weitere Gene im Genkonstrukt vorliegen. 

45 Vorteilhafte Regulationssequenzen ftir das neue Verfahren liegen 
beispielsweise in Promotoren vor, wie dem cos-, tac-, trp-, tet-, 
trp-tet-, Ipp-r lac-, Ipp-lac-, lacI^J"* T7-, T5-, T3-, gal-, trc-. 
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ara-, SP6-, ^-Pr- oder A,--PL-Proinotor \ind werden vorteilhaf terweise 
in Gram-negativen Bakterien angewendet. Weitere vorteilhaf te 
Regulationssequenzen liegen beispielsweise in den Gram-positiven 
Proiaotoren amy xxnd SP02, in den Hefe- oder Pilzpromotoren ADCl, 
5 MFa, AC, P-6Q, CYCl, GAPDH, TEF, rp2B, ADH oder in den Pflanzen- 
promotoren CaMV/35S [Franck et al., Cell 21 (1980) 285-294], 
PRPl [Ward et al.. Plant. Mol. Biol, 22 (1993)], SSU, OCS, lib4, 
usp, STLSl; B33, nos oder im Ubiquitin- oder Phaseolin-Promotor 
vor. In diesem Zusainrtienhang vorteilhaf t sind ebenfalls induzier- 

10 bare Promotoren, wie die in EP-A-0 388 186 (Benzylsulfonamid- 
induzierbar) , Plant J. 2, 1992:397-404 (Gatz et al., Tetra- 
cyclin-induzierbar) , 335 528 (Abzisinsaure-induzierbar) 

oder WO 93/21334 (Ethanol- oder Cyclohexenol-induzierbar) be- 
schriebenen Promotoren. Weitere geeignete Pf Icinzenproniotoren sind 

15 der Promotor von cytosolischer FBPase oder der ST-LSI-Proniotor 
der Kartoffel (Stockhaus et al., EMBO J. 8, 1989, 2445), der 
Phosphoribosylpyrophosphataiaidotransferase-Promotor aus Glycine 
max (Genbank-Zugangsnr. U87999) oder der in EP-A-0 249 676 
beschriebene nodienspezifische Promotor. Besonders vorteilhaf te 

20 Promotoren sind Promotoren, welche die Expression in Geweben 

ermoglichen, die an der Fettsaurebiosynthese beteiligt sind. Ganz 
besonders vorteilhaf t sind samenspezifische Promotoren, wie der 
ausftihmngsgemaSe USP Promotor aber auch andere Pi-omotoren wie 
der LeB4- (Baeumlein et al.. Plant J., 1992, 2 (2) (2) :233-239) , 

25 DC3 (ThomaSi Plant Cell 1996, 263:359-368), Phaseolin- oder 
Napin-Promotor . Weitere besonders vorteilhaf te Promotoren 
. sind samenspezifische Promotoren, die fur monokotyle oder 
dikotyle Pflanzen verwendet werden k6nnen land in US 5,608,152 
. (Napin-Promotor aus Raps), WO 98/45461 (Oleosin- Promotor aus 

30 Arobidopsis) , US 5,504,200 (Phaseolin- Promotor aus Phaseolus 
vulgaris), WO 91/13980 (Bce4-Promotor aus Brassica) , von 
Baeumlein et al.. Plant J., 1992, 2 (2) :233-239 (Le34- 
Promotor aus einer Leguminose) beschrieben sind, wobei sich 
diese Promotoren far Dikotyledonen eignen. Die folgenden 

35 Promotoren eignen sich beispielsweise fiir Monokotyledonen lpt-2- 
oder Ipt-l-Promotor aus Gerste (WO 95/15389 und WO 95/23230), 
Hordein-Promotor aus Gerste und andere, in WO 99/16890 
beschriebene geeignete Promotoren. 

40 Es ist im Prinzip moglich, alle natiirlichen Promotoren mit ihren 
Regulationssec[uenzen, wie die oben genannten, fUr das neue Ver- 
. f ahren zu verwenden. Es ist ebenfalls mSglich und vorteilhaf t, 
zusatzlich synthetische Promotoren zu verwenden. 

45 Das Genkonstrukt kann, wie oben besclirieben, auch weitere Gene 
umfassen, die in die Organismen eingebracht werden sollen. Es ist 
m5glich und vorteilhaf t, in die Wirtsorgcuiismen Regulationsgene, 
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wie Gene fur Induktoren, Repressoren oder Enzyme, welche durch 
ihre Enzymaktivitat in die Regijlation eines oder mehrerer Gene 
eines Biosynthesewegs eingreifen, einzubringen und darin zu 
exprimieren, Diese Gene konnen heterologen oder homologen 
5 Urspriings sein, Weiterhin kannen vorteilhaft im NukleinsSurekon- 
strukt bzw. Genkonstrukt weitere Biosynthesegene des FettsSure- 
oder Lipids t of fwechsels enthalten sein oder aber diese Gene 
konnen auf einem weiteren oder mehreren weiteren Nukleinsaure- 
konstrukten liegen. Vorteilhaft v/erden als Biosynthesegene des 

10 Fettsaiire- oder Lipidstof fwechsels ein Gen ausgewMhlt aus der 
Gruppe Acyl-CoA-Dehydrogenase(n) , Acyl-ACP[= acyl carrier 
protein] -Desaturase(n) , Acyl-ACP-Thioesterase (n) , Fettsaure-Acyl- 
Transferase(n) , Fettsaure-Synthase (n) , FettsSure-Hydroxylase (n) , 
Acetyl-Coenzym A-Carboxylase(n) r Acyl-Coenzym, A-Oxidase (n) , 

15 Fettsaure-Desaturase (n) , Fettsaiire -Acetyl enasen, Lipoxygenasen, 
Triacylglycerol-Lipasen, Allenoxid-Synthasen, Hydroperoxid-Lyasen 
Oder Fettsaure-Elongase(n) oder deren Kombinationen verwendet. 

Genkonstrukte iJinfassen vorteilhaf terweise zur Expression der 
20 anderen vorliegenden Gene weitere 3'- und/oder S'-terminale 
Regulationssequenzen zur Steigez^ng der Expression, die in 
Abhfingigkeit vom gewShlten Wirtsorganismus und dem Gen oder 
den Genen fiir die optimale Expression ausgewahlt werden. 
Diese Regulationssequenzen sollen, wie oben erwfihnt, die 
25 spezifische Expression der Gene xind die Proteinexpression 

ermSglichen, Dies kemn je nach dem Wirtsorganismus beispiels- 
weise bedeuten, dkss das Gen nur nach Induktion exprimiert oder 
liber exprimiert wird oder dass es sofort exprimiert und/oder 
tiberexprimiert wird. 

30 

Die Regulationssequenzen oder -faktoren kiSnnen auSerdem vorzugs- 
weise eine vorteilhafte Wirkung auf die Expression der ein- 
gebrachten Gene haben und diese somit steigem. Auf diese Weise 
ist eS' moglich, dass die Regulationselemente xmter Verwendung 
35 starker Trans3criptionssignale, wie Promotoren und/oder Enhancer, 
vorteilhaf terweise auf Transkriptionsebene verstarkt werden. Es 
ist jedoch weiterhin auch moglich, die Translation z\m Beispiel 
durch Verbesserung der mRNA-Stabilitat zu verstarken. 

40 C. Rekombinante Expressionsvektoren und Wirtszellen 

Ein weiterer Aspekt der Erfindxing betrifft Vektoren, vorzugs- 
weise Expressionsvektoren, die eine Nukleinsaure enthalten, 
die eine Desaturase allein (oder einen Teil davon) oder ein 
45 unter Puiikt b beschriebenes NukleinsSurekonstrukt in dem die 
erfindungsgemSSe NukleinsSure allein oder in Kombination mit 
weiteren Biosynthesegenen des Fettsaure- oder Lipidstof fwechsels 
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wie Desaturasen oder Elongasen enthalten ist. Wie hier verwendet, 
betrifft der Begriff "Vektor" ein Nukleinsauremolekiil, das eine 
andere Nukleinsaure transportieren kaim, an welche es gebunden 
ist, Ein Vektortyp ist ein "Plasniid'', was fiir eine zirkulare 
5 doppelstrangige DNA-Schleife steht, in die zusatzliciien DNA- 
Segmente ligiert warden konnen. Ein weiterer Vektortyp ist 
ein viral er Vektor, wobei zusStzliche DNA-Segiaente in das 
virale Genom ligiert werden konnen. Bestimmte Vektoren kSnnen 
in einer Wirtszelle, in die sie eingebracht worden sind, 

10 autonom replizieren (z.B. Bakterienvektoren mit bakteriellem 
Replikationsur sprung und episomale SSugervektoren) . Andere 
Vektoren (z.B. nicht -episomale Saugervektoren) werden beim 
Einbringen in die Wirtszelle in das Genom einer Wirtszelle 
integriert xmd dadurch zusammen mit dem Wirtsgenom repliziert. 

15 Zudem k6nnen bestimmte Vektoren die Expression von Genen, mit 
denen sie funktionsfahig verbunden sind, steuern. Diese Vektoren 
werden hier als "Expressionsvektoren" bezeichnet. Gewohnlich 
haben Expressionsvektoren, die fiir DNA-Rekombinationstechniken 
geeignet sind, die Form von Plasmiden. In der vorliegenden 

20 Beschreibung konnen "Plasmid" und "Vektor" austauschbar ver- 
wendet werden, da das Plasmid die am haufigsten verwendete 
Vektorform ist. Die Erfindung soil jedoch. diese anderen 
Expressionsvektorformen, wie virale Vektoren (z.B. replikations- 
defiziente Retroviren, Adenoviren imd adenoverwandte Viren) , 

25 die ahnliche Funktionen ausiiben, umfassen. Ferner soil der 
Begriff Vektor auch andere Vektoren, die. dem Fachmann bekannt 
sind, wie Phagen, Viren, wie SV40, CMSI, Baculovirus, Adenovirus, 
Transposons, IS-Elemente, Phasmide, Phagemide, Cosmide, lineare 
Oder zirkulare DNA, ximfassen. 

30 

Die erfindungsgemaSen rekombinanten Expressionsvektoren umfassen 
eine erf indungsgemaSe Nukleinsaure oder ein erfindungsgema&es 
Genkonstrukt in einer Form, die sich zur Expression der Nuklein- 
saure in einer Wirtszelle eighet, was bedeutet, dass die re- 

35 kombinanten Expressionsvektoren eine oder mehrere Regulations- 
sequenzen, ausgewahlt auf der Basis der zur Expression zu ver- 
wendenden Wirtszellen, die mit der zu exprimierenden Nuklein- 
sMuresequenz funktionsf^ig verbunden ist, umfasst. In einem 
rekombinanten Expressionsvektor bedeutet "funktionsfahig ver- 

40 b\inden", dass die Nukleotidsequenz von Interess© derart an 
die Regulationssequenz (en) gebunden ist, dass die Expression 
der Nukleotidsequenz moglich ist und sie aneinander gebunden 
sind, so dass beide Sequenzen die vorhergesagte, der Sequenz 
zugeschriebene Fxinktion erftillen (z.B.- in einem In-vitro- 

45 Transkriptions-ZTranslationssystem oder in einer Wirtszelle, 
wenn der Vektor in die Wirtszelle eingebracht wird) . Der 
Begriff "Regulationssequenz" soil Promotoren, Enhancer und 
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andere Expressionskontrollelemente {z.B. Polyadenylierungs- 
signale) umfassen. Diese Regulationssequenzen sind z.B, 
beschrieben in Goeddel: Gene Expression Technology: Met±Lods 
in Enzymology 185, Academic Press, San Diego, CA (1990), oder 
5 siehe: Gruber und Crosby, in: Methods in Plant Molecular Biology 
and Biotechnolgy, CRC Press, Boca Raton, Florida, Hrsgb.: Click 
und Thompson, Kapitel 7, 89-108, einschlielSlich der Literatur- 
stellen darin. Regulationssequenzen umfassen solche, welche die 
konstitutive Expression einer Nukleotidsequenz in vielen Wirts- 

10 zelltypen steuem, und solche, welche die direkte Expression der 
. Nukleotidsequenz nur in bestimmten Wirtszellen unter bestimmten 
Bedingungen steuern. Der Fachmann weifi, dass die Gestaltung 
des Expressionsvektors von Faktoren, wie der Auswahl der zu 
trans fonaierenden Wirtszelle, dem Ausmafi der Expression des 

15 gewUnschten Proteins usw. , abhtogen kann. Die erfindungsgemcLSen 
Expressionsvektoren komien in Wirtszellen eingebracht werden, um 
dadurch Proteine oder Peptide, einschlieSlich Fusionsproteinen 
Oder -peptiden, herzustellen, die von den NukleinsSuren, wie hier 
beschrieben, kodiert werden (z.B. Desatiirasen, mutante Fonaen von. 

20 Desaturasen, Pusionsproteine usw. ) . 

pie erfind-ungsgemafien rekombinanten Expressionsvektoren kOnnen 
zur Expression von Desaturasen und Elongasen in prokaryotischen 
oder eukaryotischen Zellen gestaltet sein. Beispielsweise konnen 

25 Desaturasegene in bakteriellen Zellen, wie C. glutamicum, 

Insektenzellen (unter Verwendung von Baculovirus-Expressiohs- 
vektoren) , Hefe- und anderen Pilzzellen (siehe Romanes, M.A. , 
et al. (1992) ''Foreign gene expression in yeast: a review", 
Yeast 8:423-488; van den Hondel, C.A.M.J.J., et al. (1991) 

30 "Heterologous gene expression in filamentous fungi", in: More 
Gene Manipulations in Fungi, J.W. Bennet & L.L. Lasure, Hrsgb., 
S. 396-428: Academic Press: San Diego; \ind van den Hondel, 
C. A. M.J. J., & Punt, P.J. (1991) "Gene transfer systems and vector 
development for filamentous fungi, in: Applied Molecular Genetics 

35 of Fungi, Peberdy, J.F., et al., Hrsgb., S. 1-28, Cambridge 
University Press: Cambridge), Algen (Falciatore et al., 1999, 
Marine Biotechnology. 1, 3:239-251), Ciliaten der Typen: Holo- 
trichia, Peritrichia, Spirotrichia, Suctoria, Tetrahymena, Para- 
mecium, Colpidiximr Glaucoma, Platyophrya, Potomacus, Desaturase- 

40 udocohnilembus, Euplotes, Engelmaniella und Stylonychia, ins- 

besondere der Gattung Stylonychia lemnae, mit Vektoren nach einem 
Transforxaationsverfahren, wie beschrieben in WO 98/01572, sowie 
Zellen vielzelliger Pflanzen (siehe Schmidt, R. und Willmitzer, 
L. (1988) "High efficiency AgroJbacterium tumefaci ens-mediated 

45 transformation of AraJbidopsis thaliana leaf and cotyledon 

explants" Plant Cell Rep. : 583-586; Plant Molecular Biology and 
Biotechnology, C Press, Boca Raton, Florida, Kapitel 6/7, 
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S. 71-119 (1993); F.F. White, B. Jenes et al., Techniques for 
Gene Transfer, in: Transgenic Plants, Bd. 1, Engineering and 
Utilization, Hrsgb. : Kung mid R. Wu, Academic Press (1993), 
128-43; Pofcrykus, Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 
5 (1991)/ 205-225 (und darin zitisrte Literaturstellen) ) oder 
SSugerzellen exprimiert werden. Geeignete Wirtszellen werden 
femer erortert in Goeddel, Gene Expression Technology: Methods 
in Enzymologi'^ 185, Academic Press, San Diego, CA (1990) . Der 
rekombinante Expressionsvektor kann alternativ, zvtm Beispiel 
10 Tinter Verwendtmg von T7-Promotor-Regulationsseqiien2en und 

T7 -Polymerase, in vitro transkribiert und translatiert werden. 

Die Expression von Proteinen in Prokaryoten erfolgt meist itiit 
Vektoren/ die konstitutive oder induzierbare Promotoren ent- 

13 halten, welche die Expression von Fusions- oder nicht-Fusions- 
proteinen steuern. Fusions vektoren fugen eine Reihe von Amino^ 
sauren an ein darin kodiertes Protein an, gewohnlich am Amino- 
terminus des rekombinanten Proteins, aber auch am C-Terminus 
oder fusioniert innerhalb geeigneter Bereiche in den Proteinen. 

20 Diese Fusions vektoren haben gewohnlich drei Aufgaben: 1) die 
Verstarkung der Expression von rekombinantem Protein; 2) die 
ErhiJhung der LiJslichkeit des rekombinanten Proteins und 3) die 
Unterstiitzung der Reiriigung des rekombinanten Proteins durch 
Wirkung.als Ligand bei der Af finitatsreinigung. Bei Pusions- 

25 Expressionsvektor en wird oft eine proteolytische Spaltstelle an 
der Verbindungsstelle der Fxisionseinheit \ind des rekombinanten 
Proteins eingebracht, so dass die Abtrennung des rekombinanten 
Proteins von der Fusionseinheit nach der Reinigung des Fusions- 
proteins m5glich ist. Diese Enzyme und ihre entsprechenden 

30 Erkennungssecjuenzen umfassen Faktor Xa, Thrombin und Entero- 
kinase . 

Typische Fusions-Expressionsvektoren sind u.a. pGEX (Pharmacia 
Biotech Iric; Smith, D.B., und Johnson, K.S. (1988) Gene 

35 67:31-40),. pMAL (New England Biolabs, Beverly, MA) und pRITS 
(Pharmacia, Piscataway, NJ) , bei denen Glutathion-S-Transf erase 
(GST) , Maltose E-bindendes Protein bzw. Protein A an das 
rekombinante Zielprotein fusioniert wird. Bei einer Ausfiih2ningS'- 
form ist die Desaturase-kodierende Sequenz in einen pGEX- 

40 Expressionsvektor kloniert, so dass ein Vektor erzeugt wird, 

der ein Fusionsprotein kodiert, das vom N-Terrainus zum C-Terminus 
GST-Thrombin-Spaltstelle-X-Protein umfasst. Das Fusionsprotein 
kann durch Af f initatschromatographie unter Verwendung von Gluta- 
thion-Agarose-Harz gereinigt werden. Rekombinante Desaturase, die 

45 nicht an GST fusioniert ist, kann durch Spaltung des Fusions- 
proteins mit Thrombin* gewonnen werden. 
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Beispiele fur geeignete induzierbare nicht-Fusions-E. coli- 
Expressionsvektoren sind u.a. pTrc (Amann et al. (1988) Gene 
69:301-315) \md pET lid (Studier et al.. Gene Expression 
Technology; Methods in Enzymology 185, Academic Press, San Diego, 
5 Kalifornien (1990) 60-89) . Die Zielgenexpression vom pTrc-Vektor 
ber\iht auf der Transkription durch Wirts-RNA-Polymerase von einem 
Hybrid-trp-lac-Pusionspromotor. Die Zielgenexpression aus dem pET 
lld-Vektor beruht auf der Transkription von einem TV-gnlO-lac- 
Pusions-Promotor , die von einer coexprimierten viralen RNA-Poly- 
10 merase (T7 gnl) vermittelt wird. Diese virale Polymerase wird 
von den Wirtsstammen BL21 (DE3) oder HMS174. (DE3) von einem 
residenten ^-Prophagen bereitgestellt , der ein T7 gnl -Gen unter 
der Transkriptionskontrolle des lacUV 5-Promotors birgt. 

15 Andere in prokaryotischen Organismen geeignete Vektoren sind dem 
Fachmann bekannt, diese Vektoren sind beispielsweise in E. coli 
PLG338, PACYC184, die pBR-Reihe, wie pBR322, die pUC-Reihe^ wie 
pUC18 Oder pUCl9, die M113mp-Reihe, pKC30, pRep4, pHSl, pHS2, 
pPLc236, PMBL24, pLG200, pUR290, pIN-IIll"-Bl, X^tll or pBdCl, 

20 in Streptorayces pIJlOl, pIJ364, pIJ702 oder prj361, in Bacillus 
pUBllO, pC194 oder pBD214, in Corynebacterium pSA77 oder pAJ667. 
Eine Strategie zur Maximierung der Expression von rekombinantem 
Protein ist die Expression des Proteins in einem Wirtsbakterium, 
dessen Fahigkeit zur proteolytischen Spaltung des rekombinanten 

25 Proteins gestort ist (Gottesman, S., Gene Expression Technology: 
Methods in Enzymology 185, Acadanic Press, San Diego, Kalifornien 
(1990) 119-128) • Eine weitere Strategie ist die Veranderung der 
Nukleinsauresequenz der in einen Expressionsvektor zu inserieren- 
den Nukleinsaure , so dass die einzelnen Codons fur jede Amino- 

30 sSure diejenigen sind, die vorzugsweise in einem zur Expression 
ausgewahlten Bakterium, wie C. glut ami cum, veirwendet werden 
(Wada et al . (1992) Nucleic Acids Res. 20:2111-2118). Diese 
VerandejTung der erf indungsgemaSen Nukleinsauresequenzen erfolgt 
durch Standard-DNA-Synthesetechniken. 

35 

Bei einer weiteren Aus fuhrungs form ist der Desaturase- 
Expr ess ions vektor ein Hefe-Expressionsvektor , Beispiele fOr 
Vektoren zur Expression in der Hefe S. cerevisiae umfassen 
pYeDesaturasecl (Baldari et al. (1987) Embo J. 6:229-234), 

40 pMFa (Kurjan und Herskowitz (1982) Cell 30:933-943), pJRY88 

(Schultz et al. (1987) Gene 54:113-123) sowie pYES2 (Invitrogen 
Corporation, San Diego, CA) . Vektoren und Verfahren zur Kon- 
struktion von Vektoren, die sich zur Veirwendung in anderen 
Pilzen, wie den filamentSsen Pilzen, eignen, umfassen diejenigen, 

45 die eingehend beschrieben sind in: van den Hondel, C. A. M.J. J., & 
Punt, P.J. (1991) 'Gene transfer systems and vector development 
for filamentous fungi, in: Applied Molecular Genetics of fxm.gi. 



wo 02/057464 



PCT/EP02/00461 



52 

J.F. Peberdy et al., Hrsgb., S. 1-28, Cambridge University Press: 
Cambridge, oder in: More Gene Manipulations in Fungi [J.W. Bennet 
& L.L. Lasure, Hrsgb., S. 396-428: Academic Press: San Diego]. 
Weitere geeignete Hefevektcren sind beispielsweise pAG-1, YEp6, 
5 YEpl3 Oder pEMBLYe23 . 

Altemativ kSnnen die erfindungsgemSSen Desaturasen in Insekten- 
zellen unter Verwendxing von Baculovirus-Expressionsvektoren 
exprimiert v/erden. Baculovirus-Vektoren, die zur Expression von 
10 Proteinen in geztLchteten Insektenzellen (z.B. Sf9-Zellen) ver- 
fUgbar sind, nmfassen die pAc-Reihe (Smith et al. (1983) Mol. 
Cell Biol,. 3:2156-2165) und die pVL-Reihe (Lucklow und Sxmtmers 
(1989) Virology 170:31-39). 

15 Die oben genannten Vektoren bieten nur einen kleinen Uberblick 
aber mogliche geeignete Vektoren. Weitere Plasmide sind dem 
Fachmann bekannt und sind zum Beispiel beschrieben in: Cloning 
Vectors (Hrsgb. Pouwels, P.H., et al., Elsevier, Amsterdam- 
New York-Oxford, 1985, ISBN 0 444 904018). 

20 

Bei noch einer weiteren Ausfiihrungsform wird eine erfindungs- 
gemaiSe NukleinsSLure in saugerzellen \mter verwendung eines 
SsLuger-Expressionsvektors exprimiert. Unter SSugem warden 
im Sinne der Erfindung alls nicht-humanen Sanger verstanden. 

25 Beispiele fiir Sauger-Expressionsvektoren umfassen pCDM8 (Seed, 
B. (1987) Nature 329:840) und pMT2PC (Kaufman et al. (1987) 
EMBO J. 6:187-195). Bei der Verwendung in SSugerzellen werden 
die Kontrollfunktionen des Express ionsvekt or s oft von viralen 
Regulationselementen bereitgestellt . Ublicherweise verwendete 

30 Promotoren stammen z.B. aus Polyoma, Adenovirus2, Cytomegalie- 
virus und Simian Virus 40. Weitere geeignete Express ions syst erne 
fiir prokaryotische und eukaryotische Zellen siehe in den Kapiteln 
16 und 17 von Sambrook, J., Fritsch, E*F., und Maniatis, T. , 
Molecular Cloning: A Laboratory Manual, 2, Auflage, Cold Spring 

35 Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold 
Spring Harbor, NY, 1989. 

Bei einer anderen Ausfiihrungsform kann der rekombinante Sauger- 
Expressionsvektor die Expression der Nukleinsaure vorziigsweise in 

40 einem bestimmten Zelltyp steuern (z.B. werden gewebespezifische 
Regulationselemente zur Expression der Nukleinsd.ure verwendet) . 
Gewebespezifische Regulationselemente sind im Fachgebiet bekannt. 
Nicht beschrankende Beispiele fur geeignete gewebespezifische 
Promotoren sind u.a. der Albuminpromotor (leberspezif iscl^; 

45 Pinkert et al. (1987) Genes Dev. 1:268-277), lymphoidspezif ische 
Promotoren (Calame und Eaton (1988). Adv. Immunol. 43:235-275), 
insbesondere Promotoren von T-Zellrezeptoren (Winoto und 
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Baltimore (1989) EMBO J- 8:729-733) und Immunglobulinen (Banerji 
et al. (1983) Cell 33:729-740; Queen xind Baltimore (1983) Cell 
33:741-748), neuronspezif ische Proiaotoren (z,B. Ne\irofilament- 
Promotor; Byrne und Ruddle (19B9) PNAS 86:5473-5477), pankreas- 
5 spezifische Promptoren (Edlund et al,, (1985) Science 

230:912-916) und milchdriisenspezif ische Promotoren (z.B. Milch- 
serum-Promotor; US-Patent Nr. 4,873,316 und EuropMische Patent- 
anmeldung-Verof fentlichung Nr. 264,166). Auch entwicklungs - 
regulierte Promotoren sind umfasst, z.B. die hox-Proiuotoren 
10 der Maus (Kessel und Gruss (1990) Science 249:374-379) und 

der Fetoprotein-Promotor (Campes und Tilghman (1989) Genes Dev. 
3:537-546) . 

Bei einer weiteren Ausftlhrungsf orm kSnnen die erf indungsgemaSen 
15 Desaturasen in einzelligen Pflanzenzellen (wie Algen) , siehe 
Falciatore et al . , 1999, Marine Biotechnology 1 (3):239-251 
und darin zitierte Literaturangaben, und Pflanzenzellen aus 
hoheren Pflanzen (z.B. Spermatophyten, wie Feldfriichten) 
exprimiert werden, Beispiele fur Pflanzen-Expressionsvektoren 
20 umfassen solche, die eingehend beschrieben sind in: Becker, D., 
Kemper, E. , Schell, J., und Master son, R. (1992) "New plant 
binary vectors with selectable markers located proximal to the 
left border". Plant Mol. Biol. 20:1195-1197; und Bevan, M.W. 
(1984) "Binary Agrobacterium vectors for plant transformation", 
25 Nucl. Acids Res. 12:8711-8721; Vectors for Gene Transfer in 
Higher Plants; in: Transgenic Plants, Bd, 1, Engineering and 
Utilization, Hrsgb.: Kirng und R. Wu, Academic Press, 1993, 
S. 15-38. 

30 Bine Pflanzen-E5Q>ressionskassette enthalt vorzugsweise 

Regulationssequenzen, welche die Genexpression in Pflanzen- 
zellen steuern kOnnen und funktionsfahig verbunden sind, so dass 
jede Sequenz ihre Fionktion, wie Termination der Transkription, 
erfxillen kann, beispielsweise Polyadenylierungssignale. Bevor- 

35 zugte Polyadenylierungssignale sind diejenigen, die aus Agro- 
bacterixica tumef aciens-t-DNA stammen, wie das als Octopinsynthase 
bekannte Gen 3 des Ti-Plasmids pTiACH5 (Gielen et al., EMBO 
J. 3 (1984) B35ff.) oder funktionelle Aquivalente davon, aber 
auch alle anderen in Pflanzen funktionell aktiven Terminatoren 

40 sind geeignet. 

Da die Pf lanzengenexpression sehr oft nicht auf Transkriptions- 
ebenen beschrSnkt ist, enthalt eine Pflanzen- Expressionskassette 
vorzugsweise andere funktionsfahig verbunden Sequenzen, wie 
45 Translations enhancer, beispielsweise die Overdrive- Sequenz , 
welche die 5 ' -untranslatierte Leader-Sequenz aus Tabakmosaik- 
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virus, die das Protein/RNA-Verhtltnis erhdht, enthalt (Gallie 
et al., 1987, Nucl. Acids Research 15:8693-8711). 

Die Pf lanzengenexpression muss funktionsf Shig mit einem 
5 geeigneten Promotor verbunden sein, der die Genexpression auf 
rechtzeitige, zell- oder gewebespezifische Weise durchf ^ihrt . 
Bevorzugt sind Promotoren, welche die konstitutive Expression 
herbeifuhren (Benfey et al., EMBO J. 8 (1989) 2195-2202), wie 
diejenigen, die von Pf lanzenviren stammen, wie 35S CAMV (Franck 
10 et al., Cell 21 (1980) 285-294), 19S CaMV (siehe auch' US 5352605 
und WO 84/02913) oder Pf lanzenpromotoren, wie der in US 4,962,028 
beschriebene der kleinen Untereinheit der Rubisco. 

Andere bevorzugt e Sequenzen fiir die Verwendung zur funktions- 
15 fahigen Verbindung in Pf lanzengenexpressions-Kassetten sind 

Targeting-Sequenzen, die zur Steuerung des Genproduktes in sein 
entsprechendes Zellkompartiment notwendig sind (siehe eine Uber- 
sicht in Kermode, Crit. Rev. Plant Sci. 15, 4 (1996) 285-423 
xmd darin zitierte Literaturstellen) , beispielsweise in die 
20 Vakuole, den Zellkern, alle Arten von Plastiden, wie Amylo- 

plasten, Chi or opl as ten, Chromoplasten, den extrazellularen Raum, 
die Mitochondrien, das Bndoplasmatische Retikulum, Olkdrper, 
Peroxisomen xind andere Kompartimente von Pf lemzenzellen. 

25 Die Pflanzengenexpression lasst sich auch uber einen chemisch 
induzierbairen Promotor erleichtern (siehe eine Obersicht in Gatz 
1997, Annu. Rev. Plant Physiol. Plant Mol. Biol,, 48:89-108). 
Chemisch induzierbare Promotor en eignen sich besonders, wenn 
gewiinscht wird, dass die Genexpression auf zeitspezifische Weise 

30 erfolgt. Beispiele fUr solche Promotoren sind ein SalicylsSure- 
induzierbarer Promotor (WO 95/19443), ein Tetracyclin-induzier- 
barer Promotor (Gatz et al. (1992) Plant J. 2, 397-404) und ein 
Ethanol-induzierbarer Promotor. 

35 Auch Promotoren, die auf biotische oder abiotische Stress - 

bedingungen reagieren, sind geeignete Promotoren, beispielsweise 
der pathogeninduzierte PRPl-Gen-Proraotor (Ward et al., Plant. 
Mol. Biol. 22 (1993) 361-366), der hit ze induzierbare hsp80- 
Promotor aus Tomate (US 5,187,267), der kalteinduzierbare Alpha- 

40 amylase-Promotor aus Kartoffel (WO 96/12814) oder der durch 
Wunden induzierbare pinll-Promotor (EP-A-0 375 091) . 

Es sind insbesondere solche Promotoren bevorzugt, welche die 
Genexpression in Geweben und Organen herbeifiihren, in denen 
45 die Lipid- und Olbiosynthese stattfindet, in Samenzellen, wie 
den Zellen des Endosperms und des sich entwickelnden Embryos. 
Geeignete Promotoren sind der Napingen-Promotor aus Raps 
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(US 5, 608; 152), der USP-Promotor aus Vicia faba (Eaejmlein 
et al., Mol Gen Genet, 1991, 225 (3):459-67), der Oleosin- 
Promoter aus Arabidopsis (WO 98/45461), der Phaseolin-Pramotor 
aus Phaseolus vulgaris (US 5,504,200), der Bee 4 -Promo tor aus 
5 Brassica (WO 91/13980) oder der Leguinin-B4-Promotor (LcB4; 
Baeuinlein et al., 1992, Plant Journal, 2 {2):233-9) sowie 
Promotoren, welche die samenspezifische Expression in Mono- 
kotyledonen-Pf lanzen, wie Mais, Gerste, Weizen, Roggen, Reis usw. 
herbeif uiiren . Geeignete beachtenswerte Promotoren sind der lpt2- 

10 Oder Iptl-Gen-Promotor aus Gerste (WO 95/15389 una VIO 95/23230) 
Oder die in WO 99/16890 beschriebenen (Promotoren aus dem 
Gersten-Hordein-Gen, dem Reis-Glutelin-Gen, dem Re is - Or yz in -Gen, 
dem Reis-Prolainin-Gen, dem Weizen-Gliadin-Gen, Weizen-Glutelin- 
Gen, dem Mais-Zein-Gen, dem Hafer-Glutelin-Gen, dem Sorghuiu- 

15 Kasirin-Gen, dem Roggen-Secalin-Gen) . 

Insbesondere kann die multiparallele Expression von erfindungs- 
gemaSen Desaturasen allein oder in Kombination mit anderen 
desaturasen oder Elongasen gewQnscht sein. Die Einfuhrung solcher 

20 Expressionskassetten kann uber eine simultane Transformation 
mehrerer einzelner Expressionskonstrukte erfolgen oder durch 
Kombination mehrerer Expressionskassetten auf einem Konstrukt. 
Auch k6nnen mehrere Vektoren mit mit jeweils mehreren 
Exopressionskassetten transformiert und auf die Wirtszelle 

25 liber tragen werden. 

Ebenfalls besonders geeignet sind Promotoren,. welche die 
plastidenspezif ische Expression herbeifiihren, da Plastiden 
das Kompartiment sind, in deiti die Vorlaufer spwie einige End- 
30 produkte der Lipidbiosynthese synthetisiert werden. Geeignete 
Promotoren, wie der virale RNA~Polymerase~Promotor , sind 
beschrieben in WO 95/16783 und WO 97/06250, und der clpP- 
Promotor aus Arabidopsis, beschrieben in WO 99/46394. 

35 Die Erfindung stellt zudem einen rekombinanten Expressions- 
vektor bereit, umfassend ein erf indtingsgemaSes DNA Molekiil, 
das in Ant is ens e-Richtung in den Expressionsvektor kloniert 
ist. d.h. das DNA-Molekiil ist derart mit einer regulatorischen 
Seguenz funktionsfahig verbunden, dass die Expression (durch 

40 Transkription des DNA-Molektils) eines RNA-MolekUls, das zur 
DesaturasenmRNA ''Antisense"- ist, erm6glicht wird. Es konnen 
Regulationssequenzen ausgew^lt werden, die fuiiktionsf^ig mit 
einer in Antisense-Richtung klonierten Nukleinsaure verbunden 
sind und die kontinuierliche Expression des Antisense-RKA-Mole- 

45 kills in einer Vielzahl von Zelltypen steuem, zum Beispiel k5nnen 
virale Promotoren und/oder Enhancer oder Regulationssequenzen 
ausgewahlt werden, welche die konstitutive, gewebespezif ische 
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Oder zelltypspezif ische Expression von Antisense-RNA steuern. 
Der Antisense-Expressionsvektor kaim in Form eines rekombinanten 
Plasmids, Phagemids oder attenuierten Virus vorliegen, in dem 
Antisense-lSlukleinsaiiren unter der Kontrolle eines hochwirksamen 
5 regulator ischen Bereichs produziert werden, dessen Aktivitat 
durch den Zelltyp bestimmt warden kann, in den der Vektor 
eingebracht worden ist. Eine BrlSuterung der Regulation der 
Genexpression mittels Anti sense-Gen en siehe in Weintraub, H., 
et al., Antisense-RNA as a molecular tool for genetic analysis, 
10 Reviews - Trends in Genetics, Bd. 1(1) 1986. 

Ein weiterer Aspekt der Erfindung betrifft Wirtszellen, in die 
ein erf indungsgemafier rekombinanter Express ions vektor eingebracht 
worden ist. Die Begriffe "Wirtszelle" und "rekombinantc Wirts- 

15 zelle'' werden hier untereinander austauschbar verwendet. Selbst- 
verstMndlich betreffen diese Begriffe nicht nur die bestimmte 
Zielzelle^ sondem auch die Nachkommen oder potentiellen Nach- 
kommen dieser Zelle. Da in aufeinanderf olgenden Generationen auf- 
grund von Mutation oder Umwelteinf Itissen bestimmte Modif ikationen 

20 auftreten konnen, sind diese Nachkommen nicht unbedingt mit der 
Parentalzelle identisch, sind jedoch immer noch vom Umfang des 
Begriffs, wie hier verwendet, umfasst. 

Unter Rekombinant oder Transgen beispielsweise rekombinanten 
25 Expressionsvektor oder rekombinanten Wirt oder Wirtszellen im 
Sinne der Erfindung ist zu verstehen, dass die erfindungsgemSfien 
Nukleins^uren und/oder deren natiirliche Regulations sequenz en an 
5' und 3 '-Position der Nukleinsauren nicht in ihrer nattirlichen 
Umgebung sind, das hei&t entweder wurde die Lage der Sequenzen im 
30 Herkunfstorganismus verSndert oder in diesem wurden die Nuklein- 
saure sequenzen und/oder die Regulationssequenzen mutiert oder die 
erfindungsgemaSen Nukl e ins aure sequenzen wurden in einen anderen 
Organismus als den Herkunfstorganismus verbracht oder deren 
Regulationssequenzen- Auch Kombinationen dieser Veranderungen 
35 sind moglich. Unter naturlicher Umgebung ist die Lage einer 
Nukleinsauresequenz in einem Organismus zu verstehen, wie er 
in der Natur vorkommt. 

Eine Wirtszelle kann eine prokaryotische oder eukaryotische 
40 Zelle sein. Zum Beispiel kann eine Desaturase in Bakterienzellen, 
wie C. glutamicum, Insektenzellen, Pilzzellen oder S^ugerzellen 
(wie Chinesischer Hamster-Ovarzellen (CHO) oder COS-Zellen) , 
Algen, Ciliaten, Pf lanzenzellen, Pilzen oder anderen Mikro- 
organismen, v/ie C. glutamic\am, exprimiert werden. Andere 
45 geeignete Wirtszellen sind dem Fachmann gelSufig. 
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Vektor-DNA ISsst sich in prokaryotische oder eukaryotische Zellen 
iiber herkommiiche Transformaticns- oder Transfektionstechniken 
einbringen. Die Begriffe "Transfonoation" und "Transfektion", 
Konjugation und Transduktion, wie hier verwendet, sollen eine 
5 Vielzahl von im Stand der Technik bekannten Verfahren zum 

Einbringen fremder Nukleinsaure (z.B. DNA) in eine Wirtszelle, 
einschliefilich Calciumphosphat- oder Calciiamchlorid-Coprazi- 
pitation, DEAE-Dextran-verraittelte Transf ektion, Lipofektion, 
natiirliche Kompetenz, cheinisch vermittelter Transfer, Elektro- 

10 poration oder TeilchenbeschusS/ umfassen. Geeignete Verfahren 
zur Trcinsf ormation oder Transfektion von Wirtszellen, einschlieS- 
lich Pf lanzenzellen, lassen sich finden in Sambrook et al. 
(Molecular Cloning: A Laboratory Manual., 2, Aufl., Cold Spring 
Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold 

15 Spring Harbor, NY, 1989) und anderen Labor-Handbllchern, wie 
Methods in Molecular Biology, 1995, Bd. 44, Agrobacterium 
protocols, Hrsgb: Gartland und Davey, Humana Press, Totowa, 
New Jersey. 

20 liber die stabile Transfektion von SSugerzellen ist bekannt; 
dass je nach veirwendetem Expressionsvektor und verwendeter 
Trans fektionstechnik nur'ein kleiner Teil der Zellen die fremde 
DNA in ihr Genoiti integriert. Zur Identif ikation und Selektion 
dieser Integranten wird gewGhnlich ein Gen, das einen selektier- 

25 baren Marker (z.B. Resistenz gegen Antibiotika) kodiert, zusaitunen 
mit dem Gen. von Interesse in die Wirtszellen eingebracht. Bevor- 
zugte selektierbare Marker umfassen solche, welche Resistenz 
gegen Medikamente, wie G418, Hygromycin und Methotrexat, ver- 
leihen, oder in Pflanzen solche, welche Resistenz gegen ein 

30 Herbizid, wie Glyphosphat oder Glufosinat, verleihen. Weitere ge- 
eignete Marker sind beispielsweise Marker, welche Gene kodieren, 
die an Biosynthesewegen von zuiti Beispiel Zuckern oder Aminosauren 
beteiiigt sind, wie IS-Galactodsidase, ura3 oder ilv2. Marker, 
welche Gene, wie Luzif erase, gfp oder andere Fluoreszenzgene 

35 kodieren, sind ebenfalls geeignet. Diese Marker lassen sich in 
Mutanten verwenden, in denen diese Gene nicht funktionell sind, 
da sie beispielsweise mittels herkoinmlicher Verfahren deletiert 
worden sind. Femer k6nnen Marker, welche eine Nukleinsaure 
kodieren, die einen selektierbaren Marker kodiert, in eine Wirts- 

40 zelle auf dem gleichen Vektor eingebracht werden, wie derjenige, 
der eine Desaturase kodiert, oder kdnnen auf einem gesonderten 
Vektor eingebracht werden. Zellen, die mit der eingebrachten 
Nukleinsaiire stabil transf iziert worden sind, konnen zum Beispiel 
durch Medikamentenselektion identif iziert werden (z.B. iiberleben 

45 Zellen, die den selektierbaren Marker integriert haben, wohin- 
gegen die anderen Zellen absterben) . 
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Zur Erzeugung eines homolog rekombinierten Mi kro organ ismus wird 
ein Vektor hergestellt, der zuiaindest einen Abschnitt eines 
Desaturasegens enthSlt, in den eine Deletion, Addition oder 
Sxxbstitution eingebracht worden ist, um dadurch das Desaturasegen 
5 zu verandem, z.B. fimktionell zu dieriunpieren- Dieses Desatura- 
segen ist vorzugsweise ein Phaeodactylum tricomutum Desaturase- 
gen, es kann jedoch ein Homologon oder Analogon aus anderen 
Organisiaen, sogar aus einer Sauger-, Pilz- oder Insektenquelle 
verwendet warden. Bei einer bevorzugten Aus fuhrimgs form ist der 

10 Vektor so gestaltet, dass das endogene Desaturasegen bei homo- 
loger Rekoiribination funktionell disrimiptiert wird (d.h. nicht 
langer ein funktionelles Protein kodiert; auch als Knock-out- 
Vektor bezeichnet) , Alternativ kann der Vektor so gestaltet 
sein, dass das endogene Desat\irasegen bei homologer Rekombination 

15 mutiert oder anderweitig verandert wird, aber iiraner noch ein 
funktionelles Protein kodiert (z.B. kann der stromauf warts 
gelegene regulatorische Bereich so verandert sein, dass da- 
durch die Expression der endogenen Desaturase verandert wird) . 
Zur Erzeugung einer Punktmutation iiber homologe Rekombination 

20 konnen auch als Chimeraplasty bekannte DNA-RNA-Hybride ver- 
wendet warden, die aus Cole-Strauss et al., 1999, Nucleic 
Acids Research 27 (5) : 1323-1330 und Kmiec, Gene therapy, 19999, 
American Scientist, 87(3) :24G-247 bekannt sind. 

25 Im Vektor ftir die homologe Rekombination ist der veranderte 
Abschnitt des Desaturasegens an seinem 5'- und 3'-Ende von 
zusStzlicher Nukleinsaure des Desaturasegens flankiert, so dass 
homologe Rekombination zwischen dem exogenen Desaturasegen, das 
auf dem Vektor vorliegt, und einem endogenen Desaturasegen iri 

30 einem Mikroorganismus oder einer Pflanze mSglich ist. Die zusatz- 
liche flankierende Desaturase-NukleinsSure ist fur eine erfolg- 
reiche homologe Rekombination mit dem endogenen Gen hinreichend 
lang. Gewohnlich sind im Vektor mehrere hundert Basenpaare bis 
zu Kilobasen flankierende DMA (sowohl am 5'- als auch am 3'-Ende) 

35 enthalten (eine Beschreibung von Vektoren zur homologen Rekombi- 
nation siehe z.B. in Thomas, K.R. , und Capecchi, M.R. (1987) 
Cell 51:503 oder der Rekombination in Physcomitrella patens 
auf cDNA-Basis in Strepp et al., 1998, Proc. Natl. Acad. Sci. 
USA 95 (8) :4368-4373) . Der Vektor wird in einen Mikroorganismus 

40 oder eine Pf lanzenzelle (z.B, mittels Polyethylenglycol-ver- 
mittelter DNA) eingebracht, und Zellen, in denen das einge- 
brachte Desaturasegen mit dem endogenen Desaturasegen homolog 
rekombiniert ist, werden unter Verwendung im Fachgebiet bekannt er 
Techniken selektiert. 
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Bei einer anderen Ausfiihrungsf crm konnen rekombinante Organismen, 
wie Mikroorganismen, hergestellt werden, die ausgewShlte Systeme 
enthalten, welche eine regulierte Expression des eingebrachten 
Gens ermoglichen. Der EinschluS eines Desaturasegens in einem 
5 Vektor, wobei es unter die Kontrolle des lac-Operons gebracht 
wird, ermCglicht z.B. die Expression des Desaturasegens nur in 
Gegenwart von IPTG. Diese Regulations systeme sind im Fachgebiet 
bekaaint , 

10 Eine erf indungsgemafie Wirtszelle, wie eine prokaryotische oder 
eukaryotische Wirtszelle, in Kultur oder auf einem Feld wachsend, 
kann zur Produktion (d.h. Expression) einer Desaturase ver^endet 
warden, in Pflanzen kann zusatzlich ein alternatives Verfahren 
durch direkten Transfer von DNA in sich entwickelnde Bliiten (iber 

15 Elektroporation oder Gentransfer itiittels Agrobacterium ange- 
wendet werden. Die Erfindung stellt folglich. femer Verfahren 
zur Produktion von Desaturasen unter Verwendung der erf indungs- 
geinaSen Wirtszellen bereit. Bei einer Ausfuhrungsform umfasst das 
Verfahren die Anzucht der erfindungsgemaSen Wirtszelle (in die 

20 ein rekombinanter Expressionsvektor, der eine Desaturase kodiert, 
eingebracht worden ist, oder in deren Genom ein Gen eingebracht 
worden ist, das eine Wildtyp- oder verinderte Desaturase kodiert) 
in einem geeigneten Medium, bis die Desaturase produziert worden 
ist. Das Verfahren umfasst bei einer weiteren Ausfuhrungsform das 

25 Isolieren der Desaturasen aus dem Medium oder der Wirtszelle. 

Wirtszellen, die im Prinzip zum Aufnehmen der erfindungs- 
gemaEen Nukleinsaure, des erf indungsgema£en Genproduktes 
oder des erf indxmgsgemafien Vektor s geeignet sind, sind alle 

30 prokaryotischen oder eukaryotischen Organismen. Die vorteil- 
haf terweise verwendeten Wirtsorganismen sind Organismen, wie 
Bakterien, Pilze, Hefen, Tier- oder Pf lanzenzellen. Weitere vor- 
teilhafte Organismen sind Tiers oder vorzugsweise Pflanzen oder 
Telle davon. Pilze, Hefen oder Pflanzen werden vorzugsweise ver- 

35 wendet, besonders bevorzugt Pilze oder Pflanzen, ganz besonders. 
bevorzugt Pflanzen, wie Olfruchtpf lanzen, die grofie Mengen an 
Lipidverbindungen enthalten, wie Raps, Nachtkerze, Canola, 
Erdnuss, Lein, Soja, Safflor, Sonnenblume, Borretsch, oder 
pflanzen, wie Mais, Weizen, Roggen, Hafer, Triticale, Reis, 

40 Gerste, Bauiawolle, Maniok, Pfeffer, Tagetes, Solanaceen-Pf lanzen, 
wie Kartoffel, Tabak, Aubergine und Tomate, Vicia-Arten, Erbse, 
Alfalfa, Buschpflanzen (Kaf f ee, Kakao, Tee) , Salix-Arten, BSume 
(Olplame, KokosnxiE) sowie ausdauernde GrSser und Putt erf eld- 
friichte. Besonders bevorzugte erfindungsgemafie Pflanzen sind 

45 Olfruchtpf lanzen, wie Soja, Erdnuss, Raps, Canola, Lein, Nacht- 
kerze, Sonnenblvane, Safflor, Baume (Olpalme, KokosnuE) . 
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D. Isolierte Desaturase 

Ein weiterer Aspekt der Erfindimg betrifft isolierte Desaturasen 
und biologisch aktive Teile davon. Ein "isoliertes" oder "ge- 

' 5 reinigtes" Protein oder ein biologisch aktiver Teil davon ist 
im wesentlicben frei von zelluiarem Material, wenn es durch DNA- 
Rekombinationstechniken produziert wird, oder von cheiaischen Vor- 
stufen Oder andern Chemikalien, wenn es chemisch synthetisiert 
wird. Der Begriff "im wesentlichsn frei von zellularem Material'' 

10 ixmfasst Desaturase-PrSparationen, in denen das Protein von zellia- 
laren Komponenten der Zellen, in denen es natiirlich oder rekombi- 
nant produziert wird, getrennt ist. Bei einer Ausfiihrxingsf orm um- 
fasst der Ausdruck "im wesentlichen frei von zellularem Material" 
DGsaturase-Praparationen mit weniger als etwa 30 % (bezogen auf 

15 das Trockengewicht) nicht -Desaturase (hier auch als "veriinreini- 
gendes Protein" bezeichnet) , starker bevorzugt weniger als etwa 
20 % nicht-Desaturase, noch starker bevorzugt weniger als etwa 
10 % nicht-Desaturase und am starksten bevorzugt weniger als etwa 
5 .% nicht-Desaturase. Wenn die Desaturase oder ein biologisch 

20 aktiver Teil davon rekombinant hergestellt worden ist, ist sie/er 
auch im wesentlichen frei von Kulturmedium, d.h. das Kulturmedium 
macht weniger als etwa 20 %, starker bevorzugt weniger als etwa 
10 % und am starksten bevorzugt weniger als etwa 5 % des Volumens 
der Proteinpraparation aus. Der Begriff "im wesentlichen frei von 

25 chemischen Vorstufen oder anderen Chemikalien" umfasst Desatura- 
se-Praparationen, in denen das Protein von chemischen Vorstufen 
oder anderen Chemikalien getrennt ist, die an der Synthese des 
Proteins beteiligt sind. Bei einer Aus fuhrungs form umfasst der 
Begriff "im wesentlichen frei von chemischen Vorstufen oder 

30 anderen Chemikalien" Desaturase-Praparationen mit weniger als 
etwa 30 % (bezogen auf das Trockengewicht) chemischen Vorstufen 
Oder nicht -Desaturase-Chemikalien, starker bevorzugt weniger als 
etwa 20 % chemischen Vorstufen oder nicht-Desaturase-Chemikalien, 
noch starker bevorzugt weniger als etwa 10 % chemischen Vorstufen 

35 oder nicht-Desaturase-Chemikalien und am starksten bevorzugt 

weniger als etwa 5 % chemischen Vorstufen oder nicht-Desaturase- 
Chemikalien. Bei bevorzugten Ausftihrimgsf ormen weisen isolierte 
Proteine oder biologisch aktive Teile davon keine ver\anreinigen- 
den Proteine aus dem gleichen Organismus auf, aus dem die 

40 Desaturase staramt. Diese Proteine werden gewOhnlich durch 

rekombinante Expression zum Beispiel Phaeodactylum tricomutum- 
Desaturase in Pflanzen wie Physcomitrella patens bzw. o.g. 
Oder Mikroorganismen, beispielsweise Bakterien, wie E. coli, 
Bacillus sxibtilis, C, glutamic\:im, Pilzen, wie Mortierella, Hefe, 

45 wie Saccharomyces, oder Ciliaten wie Colpidium oder Algen wie 
PhaeodactyliJon hergestellt. 
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Eine erf indungsgemafie isolierte Dssaturase oder ein Teil davon 
kann auch am Stof fwechsel von zurti Aufbau von Zellmembranen in 
Phaeodactylum tricomutum notwendigen Verbindxingen oder am 
Transport von Molekiilen uber diese Meinbranen teilnehmen. Bei 
5 bevorzugten Ausfuhrungsformen umfasst das Protein oder der Teil 
davon eine Aminosauresequenz , die ausreichend homoiog zu einer 
AminosSureseguenz der SEQ ID NO; 2, 4, 6 oder 12 ist, dass das 
Protein oder der Teil davon die FEhigkeit, am Stof fwechsel von 
zvm Aufbau von Zellmembranen in Phaeodactylum tricornutum not- 

10 wendigen Verbindungen oder am Transport von Molekiilen tiber diese 
Membranen teilzunehmen, beibehait. Der Teil des Proteins ist vor- 
zugsweise ein biologisch aktiver Teil, wie hier beschrieben. Bei 
einer weiteren bevorzugten Ausfuhrungsf orm hat eine erfindungs- 
gemaSe Desaturase eine der in SEQ ID NO: 2, 4, 6 oder 12 

15 gezeigten AminoscLuresequenzen . Bei einer weiteren bevorzugten 
Ausftthrungsf orm hat die Desaturase eine Aminosaureseguenz, 
die von einer Nukleotidsequenz kodiert wird, die, zum Beispiel 
unter stringent en Bedingungen, an eine Nukleotidsequenz der 
SEQ ID NO: 1, 3, 5 oder 11 hybridisiert . Bei noch einer weiteren 

20 bevorzugten Ausfuhrungsform hat die Desaturase eine Aminosaure- 
sequenz, die von einer Nukleotidsequenz kodiert wird, die min- 
destens etwa 50 bis 60 %, vorzugsv/eise mindestens etwa 60 bis 
70 %, starker bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 %, 
90 his 95 % und noch starker bevorzugt mindestens etvra 96 %, 

25 97 %, 98 %, 99 % oder noch homologer zu einer der Aminosaure- 
sequenzen der SEQ ID NO: 2, 4, 6 oder 18 ist. Die erf indrags- 
gemaSe bevorzugte Desaturase besitzt vorzugsweise auch mindestens 
eine der hier beschriebenen Desaturase-Aktivitaten. Zum Beispiel 
umfasst eine erf indtongsgemSEe bevorzugte Desaturase eine Amino- 

30 sauresequenz, die von einer Nukleotidsequenz kodiert wird, die, 
zum Beispiel unter stringenten Bedingungen, an eine Nukleotid- 
sequenz der SEQ ID NO: 1, 3; 5 oder 11 hybridisiert und am Stoff- 
wechsel von zum Aufbau von Zellmembranen in Phaeodactylum tri- 
comutum nbtv/endigen Verbindungen oder am Transport von Molekiilen 

35 tiber diese Membranen teilnehmen kann oder eine Doppelbindung in 
eine Fettsaure mit ein, zwei, drei oder vier Doppelbindungen imd 
einer Kettenlange von Cis. C20 oder C22 einftihrt. 

Bei anderen Ausfuhrungsformen ist die Desaturase im wesent lichen 
40 homoiog zu einer AminosSuresequenz der SEQ ID NO: 2, 4 oder 6 
und behait die funktionelle Aktivitat des Proteins einer der 
Sequenzen der SEQ ID NO: 2, 4 oder 6 bei, ihre. Aminosauresequenz 
unterscheidet sich jedoch aufgrund von natlirlicher Variation oder 
l-Iutagenese, wie eingehend im obigen Unterabschnitt I beschrieben. 
45 Bei einer weiteren Ausfuhrungsform ist die Desaturase folglich 
ein Protein, das eine' Aminosauresequenz \mfasst, die mindestens 
etwa 50 bis 60 %/ vorzugsweise mindestens etwa 60 bis 70 % und 
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starker bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 %, 90' 
bis 95 % und am st^rksten bevorzugt mindestens etwa 96 %, 97 %, 
98 %, 99 % Oder noch homologer zu einer vollstandigen Aminosaure- 
sequenz der SEQ ID NO: 2, 4 Oder 6 ist und zumindest eine der 
5 hier beschriebenen Desaturase-Aktivitaten aufweist. Bei einer 
anderen Ausfiihrtingsfonu be tr if ft die Erfindung eln vollstSndiges 
Phaeodactylum tricornutum- Protein, das im wesentlichen homolog zu 
einer vollstSndigen Aminosauresequenz der SEQ ID NO: 2, 4 oder 6 
ist. 

10 

Biologisch aktive Telle einer Desaturase umfassen Peptide, 
umfassend Amino sauresequenz en, die von der Aminosaureseguenz 
einer Desaturase hergeleitet sind, z,B. eine in SEQ ID NO: 2, 
4 Oder 6 gezeigte Aminosaureseguenz oder die Aminosauresequenz 

15 eines Proteins, das zu einer Desaturase homolog ist, welche 
weniger AminosSuren als die Vollangen-Desaturase oder das 
Vollangenprotein aufweisen, das zu einer Desaturase homolog 
ist, und zumindest eine Aktivitat einer Desaturase aufweisen. 
Gewdhnlich umfassen biologisch aktive Telle (Peptide, z.B. 

20 Peptide, die zim Beispiel 5, 10, 15, 20, 30, 35, 36, 37, 38, 
39, 40, 50, 100 Oder mehr Aminosauren lang sind) eine Domane 
Oder ein Motiv mit mindestens einer Aktivitat einer Desaturase. 
Uberdies kSnnen andere biologisch aktive Telle, in denen 
andere Bereiche des Proteins deletiert sind, durch rekombinante 

25 Techniken hergestellt und beztiglich einer oder mehrerer der 

hier beschriebenen Aktivitaten untersucht werden. Die biologisch 
SLktiven Telle einer Desaturase umfassen vorzugsweise eln/eine 
Oder mehrere ausgewahlte Domanen/Motlve oder Telle davon mit 
biologischer Aktivitat. 

30 

Desaturasen werden vorzugsweise durch DNA-Rekombinationstechniken 
hergestellt. Zum Beispiel wird ein das Protein kodierendes 
Nukleinsauremolekai in einen Expressionsvektor (wie vorstehend 
beschrleben) klonlert, der Expressionsvektor wird in eine 

35 Wirtszelle (wie vorstehend beschrleben) elngebracht, und die 
Desatxirase wird in der Wirtszelle exprlmiert. Die Desaturase 
kann dann durch eln geeignetes Re inigungs schema mittels Standard- 
Proteinreinigungs techniken aus den Zellen isoliert werden. Alter- 
nativ 2ur rekombinsuiten Expression kann eine Desaturase, ein 

40 -Polypeptld, oder -Peptid mittels Standard-Peptidsynthese- 
techniken chemlsch synthetislert werden. Uberdies kann native 
Desaturase aus Zellen (z.B. Endothelzellen) z.B. unter Verwendung 
eines Anti-Desaturase-Antik6rpers isoliert werden, der durch 
Standardtechnlken produzlert werden kann, wobel eltie erfindiings- 

45 gemafie Desaturase oder ein Fragment davon verwendet wird. 
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Die Erfindimg stellt auch chimare Desaturase-Proteine oder 
Desaturase-Fusionsproteine bereit. Wie hier verwendet, iimfasst: 
ein "chimares Desat-urase-Protein" oder "Desaturase-Fusions- 
protein" ein Desatxirase--Polypeptid, das funktionsfShig an ein 
5 nicht-Desaturase-Polypeptid gebunden ist. Ein "Desaturase-Poly- 
peptid" betrifft ein Polypeptid mit einer Aminosauresequenz , die 
einer Desaturase entspricht, wohingegen ein "nicht-Desaturase- 
Polypeptid" ein Polypeptid mit einer AminosMuresequenz betrifft, 
die einem Protein entspricht, das im wesentlichen nicht homolog 

10 zu der Desaturase ist, z,B, ein Protein, das sich voiti der 
Desaturase unterscheidet und aus dem gleichen oder einem 
anderen Organismus stammt. Innerhalb des Fusionsproteins 
soli der Begriff " funktionsf ahig verbunden" bedeuten, dass 
das Desaturase-Polypeptid und das nicht-Desaturase-Polypeptid 

15 so miteinander fusioniert sind, dass beide Sequenzen die vor- 
hergesagte, der verwendeten Sequenz zugeschriefaene Funktion 
erfiillen. Das nicht-Desaturase-Polypeptid kann an den N-Terminus 
oder den C-Terminus des Desaturase-Polypeptids fusioniert sein. 
Bei einer Aus fiihrimgs form ist das Fusionsprotein zum Beispiel 

20 ein GST-Desaturase-Pusionsprotein/ bei dem die Desatxxrase- 

Sequenzen an den C-Terminus der GST-Sequenzen fusioniert sind. 
Diese Fusionsproteine kOnnen die Reinigung der rekombinanten 
Desaturasen erleichtern. Bei einer weiteren Ausfiihrungsf orm ist 
das Fusionsprotein eine Desaturase, die eine heterologe Signal- 

25 sequenz an ihrem N-Terminus aufweist. In bestimmten Wirtszellen 
(z.B. Sauger-Wirtszellen) kann die Expression und/oder Sekretion- 
einer Desaturase diirch Verwendung einer heterologen Signalsequenz 
gesteigert werden. 

30 Ein erfindungsgemaEes chimares Desaturase-Protein oder 

Desaturase-Fusionsprotein wird durch Standard-DNA-Rekombinations- 
techniken hergestellt. Zum Beispiel werden DNA-Pragmente , die 
unterschiedliche Polypeptidsequenzen kodieren, gemaS herkomm- 
licher Teclmiken im Leseraster aneinander ligiert, indem 

35 beispielsweise glatte oder tiberhSngende Enden zur Ligation, 
Restriktionsenzymspaltung zur Bereitstellung geeigneter Enden, 
Auffiillen kohasiver Enden, wie erforderlich, Behandlutig mit 
alkalischer Phosphatase, urn ungewollte Verknupfungen zu ver- 
meiden, und enzymatische Ligation eingesetzt werden. Bei einer 

40 weiteren Ausfiihrungsf orm kann das Fusionsgen durch herkammliche 
Techniken, einschlieSlich DNA-Syntheseautomaten, synthetisiert 
werden. Alternativ kann eine PCR-Amplif izierung von Genfragmenten 
unter Verwendung von Ankerprimem durchgeftihrt werden, die 
komplementMre Uberhange zwischen auf einanderf olgenden Gen- 

45 fragmenten erzeugen, die anschlieSend miteinander hybridisiert 
xmd reamplif iziert werden konnen, so dass eine chimare Gensequenz 
erzeugt wird (siehe zum Beispiel Current Protocols in Molecular 
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Biology, Hrsgb. Ausubel et al., John Wiley & Sons: 1992). Uber- 
dies sind viele Expressionsvektoren kommerziell erhaltlich, die 
bereits eine Fusionseinheit (z.3. ein GST-Polypeptid) kodieren. 
Eine Desaturase-kodierende Nukleinsaure kann in einen solchen 
5 Expressionsvektor kloniert warden, so dass die Fusionseinheit 
im Leseraster mit dem Desaturase-Protein verbimden ist. 

Homologe der Desaturase konnen durch Mutagenese, z.B. durch 
spezifische Piinktmutation oder VerktLrz\ing der Desaturase, erzeugt 

10 werden. Der Begriff "Homologe", wie hier verwendet, betrifft eine 
variante Form der Desaturase, die als Agonist oder Antagonist 
der Desaturase-Aktivitat wirkt. Ein Agonist der Desaturase kann 
im wesentlichen die gleiche Aktivitat wie die oder einen Teil 
der biologiscben Aktivitaten der Desaturase beibehalten. Ein 

15 Antagonist der Desaturase kann eine oder mehrere Aktivitaten der 
natiirlich vorkommenden Form der Desaturase durch zum Beispiel 
kompetitive Bindung an ein stromabwSrts oder -aufwSrts gelegenes 
Element der Stof fwechselkaskade fur ZellmembrcUikomponenten, 
welche die Desaturase umfasst, oder durch Bindung an eine 

20 Desaturase, welche den Transport von Verbindungen tlber Zell- 
membranen vermittelt, hemmen, wodurch die Translokation gehemmt 
wird . 

Bei einer alternativen AusfOhrungsf orm konnen Homologe der 
Desaturase durch Sichten kombinatorischer Banken von Mutanten, 

25 z.B. Verktirzungsmutanten, der Desaturase hinsichtlich Desaturase- 
Agonisten- oder -Antagonisten-AktivitSt identifiziert werden. Bei 
einer Ausf-Qhrungsf orm wird eine variegierte Bank von Desaturase- 
Varianten durch kombinatorische Mutagenese auf Nukleinsaure- 
ebene erzeugt und durch eine variegierte Genbank kodiert, Eine 

30 variegierte Bank von Desaturase-Varianten kann z.B. durch 

enzymatische Ligation eines Gemisches von synthetischen Oligo- 
nukleotiden in Gensequenzen hergestellt werden, so dass sich 
ein degenerierter Satz potentieller Desaturase-Sequenzen als 
individuelle Polypeptide oder altemativ als Satz grSEerer 

35 Fusionsproteine (z.B. fUr das Phage-Display) , die diesen Satz 
von Desaturase-Sequenzen enthalten, exprimieren lasst. Es gibt 
eine Vielzahl von Verfahren, die zur Herstellung von Banken 
potentieller Desaturase-Homologen aus einer degenerierten 
Oligonukleotidsequenz verwendet werden kOnnen, Die chemische 

40 Synthese einer degenerierten Gensequenz kann in einem DNA- 
Syntheseautomaten durchgefiihrt \md das synthetische Gen dann 
in einen geeigneten Expressionsvektor ligiert werden. Die Ver- 
wend\ing eines degenerierten Satzes von Genen ermSglicht die 
Bereitstellung samtlicher Sequenzen, die den gewUnschten Satz 

45 an potentieilen Desaturase-Sequenzen kodieren, in einem Gemisch. 
Verfahren zur Synthese degenerierter Oligonukleotide sind im 
Fachgebiet bekannt (siehe z.B. Narang, S.A. (1983) Tetrahedron 
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39:3; Itakura et al. (1984) Annu. Rev. Biochem. 53:323; Itakura 
et al., (1984) Science 198:1056; Ike et al. (1983) Nucleic Acids 
Res. 11:477) . 

5 Zusatzlich konnen Banken von Desattirase-Fragmenten zur Her- 

stellimg einer variegierten Population von Desaturase-Fragmenten 
ftir das Sichten und fur die anschlielSende Selektion von Homo- 
logen einer Desaturase verwendet werden. Bei einer Ausfiihrungs- 
form kann eine Bank von Fragmenten der kodierenden Sequenz durch 

10 Behandeln eines doppelstrSngigen PCR-Fragmentes einer kodierenden 
Desaturase-Sequenz mit einer Nuklease unter Bedingtmgen, iinter 
denen Doppelstrangbriiche nur etwa eininal pro Molekul erfolgen, 
Denaturieren der doppelstrangigen DNA, Renaturieren der DNA unter 
Bildung doppelstrangiger DNA, welche Sense/Antisense-Paare von 

15 verschiedenen Produkten mit DoppelstrangbrUchen umfassen kann, 
Entfernen einzelstrSngiger Abschnitte aus neu gebildeten Duplices 
durch Behandliing mit Sl-Nuklease und Ligieren der resultierenden 
Fragmentbank in eirien Express ions vekt or erzeugt werden. Mit 
diesem Verfahren kann eine Express ionsbank hergeleitet werden, 

20 die N-terminale, C-terminale und interne Fragment e der Desatvirase 
verschiedener GroSen kodiert. 

Im Fachgebiet sind mehrere Techniken fur das Sichten von Gen- 
produkten in kombinatorischen Banken, die durch Punktmutationen 

25 Oder Verklirzung hergestellt worden sind, und fUr das Sichten von 
cDNA-Banken nach Genprodukten mit einer ausgewShlten Eigenschaft 
bekannt. Diese Techniken lassen sich an das schnelle Sichtung 
der Genbanken anpassen, die durch koinbinatorische Mutagenese 
von Desaturase-Homologen erzeugt worden sind. Die am hSufigsten 

30 verwendeten Techniken zum Sichtung grofier Genbanken, die einer 
Analyse mit hohem Durchsatz unterworfen werden konnen, um- 
fassen gewdhnlich das Klonieren der Genbank in replizierbare 
EKpressionsvektoren, Trans fonnieren von geelgneten Zellen mit der 
resultierenden Vektorenbank und Exprimieren der kombinatorischen 

35 Gene unter Bedingungen, unter denen der Nachweis der gewiinschten 
Aktivitat die Isolation des Vektors, der das Gen kodiert, dessen 
Produkt nachgewiesen wurde, erleichtert. Recursive-Ensemble-Muta- 
genese (REI'l) , eine neue Technik, die die Hauf igkeit funktioneller 
Mutanten in den Banken erhoht, kanri in Kombination mit den 

40 Sichtungstests zur Identif ikation von Desaturase-Homologen ver- 
wendet werden (Arkin und Ydurvan (1992) Proc. Natl- Acad. Sci. 
USA 89:7811-7815; Delgrave et al. (1993) Protein Engineering 
6(3) :327-331) . 

45 Eine weitere bekannt e Technik zur VerSnderung von katalytischen 
Eigenschaf ten von Enzymen bzw. deren codierenden Genen ist 
das "Gen-Shuffling" (siehe z.B. in Stemmer, PNAS 1994, 91: 
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10747-10751, W09720078 oder W09813487), das eine Kombination von 
Genfragraenten darstellt, wobei diese Neukombination zusStzlich 
noch dxirch fehlerhafte Polymerasekettenreaktionen variiert werden 
kann und somit eine hohe zu testende Sequenzdiversitat schafft. 
5 Voraussetzung fur den Einsatz eines solchen Ansatzes ist jedoch 
ein geeignetes Screeningsystem, uiti die erstellte Gendiversitat 
auf Fmktionalitat zu aberprttfen. 

Insbesondere fiir die Sichtung von Desaturaseaktivitaten 
10 ist ein Sichtiingsverfahren Voraussetzung, das PUFA-abhangig 
Enzymaktivitat (en) erfafit. Bzgl. Desaturaseaktivitaten mit 
Spezifitat fiir PUFAs kaim man in Mucor-Species, die durch 
bekannte Trans formationsverfahr en mit gewOnschten Genkonstrukten 
trans formierbar sind, die Toxizitat von Arachidonsaure in An- 
15 wesenheit eines toxischen Metaboliten {hier: SalicylsSure oder 
Salicylsaurederivate) nutzen (Eroshin et al . , Mikrobiologiya, 
Vol. 65, No.l 1996, Seiten 31-35)/ uxti eine wachstuitisbasierte 
Erstsichtung durchzuf lihren . Result ierende Klone konnen dann einer 
Analyse ihrer Lipidinhaltstof fe laittels Gaschromatographie und 
20 Massenspektrcskopie unterzogen werden, urn Edukte und Produkte in 
Art und Menge zu erfassen. 

Bei einer weiteren Ausfuhrungsf orm konnen Tests auf Zellbasis 
zur Analyse einer variegierten Desaturase-Bank unter Verwendung 
25 von weiteren im Fachgebiet bekannten Verfahren ausgenutzt werden. 

E. ErfindungsgemSEe Verwendungen und Verfahren 

Die hier beschrlebenen Nukleinsauremolekule, Proteine, Protein- 

30 homologen, Fusionsproteine, Primer, Vektoren und Wirtszellen 
k5nnen bei einem oder mehreren der nachstehenden Verfahren ver- 
wendet werden: Identif ikation von Phaeodactylum und verwandten 
Organismen, Kartierung der Genome von Organismen, die mit 
Phaeodactylum tricornutum veirwandt sind, Identif ikation und 

35 Lokalisierung von Phaeodactylxjm tricornut\ira-Sequenzen von' 

Interesse, Evolutionsstudien, Bestimmung von Desaturase-Protein- 
bereichen, die fiir die Funktion notwendig sind, Modulation einer 
Desaturase-Aktivitat; Modulation des Stof fwechsels einer oder 
mehrerer Zellmembrankoit^onenten; Modulation des Transmembran- 

40 transports einer oder mehrerer Verbindungen sowie Modulation der 
zellulSren Produktion einer gewiinschten Verbindung, wie einer 
Feinchemikalie. Die erfindungsgemdSen Desaturase-Nukleinsaure- 
molekiile haben eine Vielzahl von Verwendungen. Sie konnen- 
zunSchst zur Identif ikation eines Organismus als Phaeodactyliim 

45 tricornutum oder als naher Verwandter davon verwendet werden. Sie 
konnen auch zur Identifikation des Vorliegens von Phaeodactylum 
tricornutum oder eines Verwandten davon in einer Idischpopulation 
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von Mikroorganismen verwendet v/erden. Die Erfindung stellt die 
NukleinsS-uresequenzen einer Reihe von Phaeodactyliaiu tricornutxim- 
Genen bereit; durch Sondieren der extrahierten genomischen DNA 
einer Kultur einer einheitlichen oder gemischten Population von 
5 Mikroorganismen unter stringent en Bedingungen mit einer Sonde, 
die einen Bereich eines Phaeodactylum tricornutuan -Gens oder von 
Teilen davon uberspannt, das fur diesen Organismus einzigartig 
ist, kann man bestinunen, ob dieser Organismus vorliegt. Phaeo- 
dactylum tricornutum selbst werden zur kommerziellen Produktion 
10 mehrfach ungesattigter Sauren verwendet xind eignen dartlber hinaus 
zur PUFA-Produktion auch in anderen Organismen insbesondere wenn 
erreicht werden soil, dass resultierende PUFAs auch in die Tri- 
acylglycerolf raktion eingebaut werden sollen. 

15 Ferner konnen die erf indungsgemaiSen Nukleinsaure- und Protein- 
molekiile als Marker fiir spezifische Bereiche des Genoms dienen. 
Dies ist nicht nur zur Kartierung des Genoms, sondern auch fxir 
funktionelle Phaeodactylum tricomutum-Proteinen geeignet. Zur 
Identifikation des Genombereichs r an den ein bestiirantes DNA- 

20 bindendes Protein von Phaeodactylum tricornutum bindet, konnte 
das Phaeodactylum tricomutum-Genom z\m Beispiel gespalten werden 
und die Fragmente mit dem DNA-bindenden Protein inkubiert werden. 
Diejenigen, die das Protein binden, kdnnen zusatzlich mit den 
erf indungsgemafien Nukleins^uremolektllen, vorzugsweise mit leicht 

25 nachweisbaren Markierungen, sondiert werden; die Bindung eines 
solchen NukleinsauremolekQls an da^ Genomfragment ermdglicht die 
Iiokalisierung des Fragments auf der Genomkarte von Phaeodactylum 
tricoznutum und erleichtert, wenn dies mehrmals mit unterschied- 
lichen Enzymen durchgefuhrt wird, eine rasche Bestimmung der 

30 Nukleinsauresequenz, an die das Protein bindet. Die erfindungs- 
gemSfien NUkleinsauremolektile kdnnen zudem ausreichend homolog 
zu den Sequenzen verwandter Arten sein, dass diese Nukleinsaure- 
molekule als Marker fiir die Konstruktion einer genomischen Karte 
bei verwandten Pilzen oder Algen dienen kSnnen. 

35 

Die erf indungsgemaEen Desaturase-Nukleins^uremolektile eignen 
sich auch fiir Evolutions- und Proteinstriiktur-Uiitersuchungen. 
Die Stof fwechsel- und Transportprozesse, an denen die er- 
f indungsgemaSen Molekiile beteiligt sind, werden von vielen 

40 prokaryotischen und eiokaryotischen Zellen genutzt; durch 
Vergleich der Sequenzen der erfindungsgemaSen Nukleinsaure- 
molekiile mit solchen, die ahnliche Enzyme aus anderen Organismen 
kodieren, kann der Evolutions-Verwandschaf tsgrad der Organismen 
bestimmt werden. Entsprechend ermoglicht ein solcher Vergleich 

45 die Bestimm\ang., welche Sequenzbereiche konserviert sind und 
welche nicht, was bei" der Bestimmung von Bereichen des Proteins 
hilfreich sein kann, die ffir die Enzymftinktion essentiell sind. 



wo 02/057464 



PCT/EP02/00461 



68 

Dieser Typ der Bestimmung ist fair Proteinengineering-Unter- 
suchungen wertvoll xind kann einen Hinweis darauf geben, wieviel 
Mutagenese das Protein tolerieren kaiin, ohne die Punktion zu 
verlieren. 

5 

Die Manipulation der erf indimgsgemafien Desaturase-Nukleinsaure- 
molektile kann zur Produktion von Desaturasen mit funktionellen 
Unterschieden zu den Wildtyp-Desaturasen fiihren. Die Effizienz 
Oder Aktivitat dieser Proteine kann verbessert sein, sie kSnnen 

10 in grdfieren Anzahlen als gewohnlich in der Zelle zugegen sein, 
Oder ihre Effizienz oder Aktivitat kann verringert sein. Ver- 
besserte Effizienz oder Aktivitat bedeutet beispielsweise, dass 
das Enzym eine hdhere Selektivitat und/oder Aktivitat, vorzugs- 
weise eine luindestens 10 % hShsre, besonders bevorzugt eine 

15 mindestens 20 % hohere Aktivitat, ganz besonders bevorzugt eine 
mindestens 30 % hohere Aktivitat als das urspriingliche Enzyiti 
aufweist. 

Es gibt eine Reihe von Mechanismen, durch die die Veranderung 

20 einer erf indungsgemaSen Desaturase die Ausbeute, Produktion 
und/oder Effizienz der Produktion einer Feincheitiikalie, welche 
ein solches verandertes Protein enthait, direkt beeinflussen 
kann. Die Gev/innung von Feinchemikalien-Verbindungen aus Kulturen 
von Ciliaten, Algen oder Pilzen im gro&en Mafistab ist signifi- 

25 kant verbessert, wenn die Zelle die gewiinschten Verbindungen 

sezerniert, da diese Verbindungen aus deia Kulturmediim (im Gegen- 
satz zur Extraktion aus der Masse der geziichteten Zellen) leicht 
gereinigt werden konnen. Ansonsten lasst sich die Reinigung ver- 
bessem, wenn die Zelle in vivo Verbindungen in einem speziali- 

30 sierten Kdc^artiinent mit einer Art Konzentrationsmechanismus 
speichert. Bei Pflanzen, die Desaturasen exprimieren, kann ein 
gesteigerter Transport zu besserer Verteilung innerhalb des 
Pflanzengewebes und der -organe fiihren. Durch VergroSem der 
Anzahl oder der Aktivitat von Transportermolekillen, welche Fein- 

35 chemikalien aus der Zelle exportieren, kann es m5glich sein, die 
Menge der produzierten Feinchemikalie, die im extrazellularen 
Mediijm zugegen ist, zu steigem, wodurch Emte und Reinigung oder 
bei Pflanzen eine effizientere Verteilung erleichtert werden. Zur 
effizienten Uberproduktion einer oder mehrerer Feinchemikalien 

40 sind dagegen erh5hte Mengen an Cofaktoren, Vorlaufermolekulen und 
Zwischenverbindungen ffir die geeigneten Biosynthesewege erforder- 
lich. Durch Vergrofiem der Anzahl und/oder der Aktivitat von 
Transporterproteinen, die am Import von Nahrstoffen, wie Kohlen- 
stoffquellen (d.h. Zuckern) , Stickstof fquellen (d.h. Aminosauren, 

45 Ammoniumsalzen) , Phosphat und Schwefel, beteiligt sind, kann 

man die Produktion eiher Feinchemikalie aufgrund der Beseitigiing 
aller Einschrankungen des Nahrstoffangebots beim Biosynthese- 
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prozess verbessern. Fettsauren, wie PUFAs, und Lipide, die PUFAs 
enthalten, sind selbst wOnschenswerte Feincheinikalien; durch 
Optimieren der AktivitSt oder Erh5hen der Anzahl einer oder 
mehrerer erf indimgsgemaSer Desaturasen, die an der Biosynthese 
5 dieser Verbindungen beteiligt sind, oder durch Storen der Aktivi- 
tat einer oder mehrerer Desaturasen , die am Abbau dieser Ver- 
bindungen beteiligt sind, kann man somit die Ausbeute, Produktion 
und/oder Effizienz der Produktion von Fettsaure- und Lipidmole- 
kule in Ciliaten, Algen, Pflanzen, Pilzen, Hefen oder anderen 
10 Mikroorganismen steigern. 

Die Manipulation eines oder mehrerer erf indungsgemafier 
Desaturase-Gene kann ebenfalls zu Desaturasen mit veranderten 
Aktivitaten f<ihren/ welche die Produktion einer oder mehrerer 

15 gewiinschter Feinchemikalien aus Algen, Pflanzen, Ciliaten oder 
Pilzen indirekt beeinf lussen. Die normalen biochemischen Stoff- 
wechselprozesse fiihren z.B. zur Produktion einer Vielzahl an 
Abfallprodukten (z.B. Wasserstof fperoxid und andere reaktive 
Sauerstoff spezies) , die diese Stof fwechselprozesse aktiv storen 

20 konnen {z.B. nitriert Peroxynitrit bekanntlich Tyrosin-Seiten- 
ketten, wodurch einige Enzyme mit Tyrosin im aktiven Zentrum 
inaktiviert werden (Groves, J.T. (1999) Curr. Opin. Chem. Biol, 
3 (2) ;226-235) ) . Diese Abfallprodukte werden zwar tiblicherweise 
ausgeschieden, aber die zur f ermentativen Produktion im groSen 

25 MaSstab verwendeten Zellen werden fur die Uberproduktion einer 
Oder mehrerer Feinchemikalien optimiert und kQnnen somit mehr 
Abfallprodukte produzieren als fur eine Wildtypzelle ublich. 
Durch Optimieren der Aktivitat einer oder mehrerer erfindungs- 
gema&er Desaturasen, die am Export von Abfallmolektilen beteiligt 

30 sind, kann man die LebensfShigkeit der Zelle verbessern und 
eine effiziente Stof fwechselaktivitat aufrechterhalten. Auch 
das Vorliegen hoher intrazellularer Mengen der gewiinschten Fein- 
chemikalie kann tatselchlich fur die Zelle toxisch sein, so dass 
man durch Steigern der Fahigkeit der Zelle zur Sekretion dieser 

35 VerbindTongen die Lebensfthigkeit der Zelle verbessern kann. 

Die erf indungsgeraSEen Desaturasen kCnnen femer so manipuliert 
sein, dass die relativen Mengen verschiedener Lipid- und Fett- 
sauremolekule verandert werden. Dies kann eine entscheidende Aus- 

40 wirkung auf die Lipidzusammensetzung der .Zellmembran haben. Da 
jeder Lipidtyp xinterschiedliche physikalische Eigenschaf ten hat, 
kann eine Veranderung der Lipidzusammensetzung. einer Membran die 
Membranf luiditat signifikant verandern. Anderxmgen der Membran- 
fluiditat konnen den Transport von Molekaien iiber die Membran 

45 beeinflussen, was, wie vorstehend erlSutert, den Export von 
Abfallprodukten oder der produzierten Feinchemikalie oder den 
Import notwendiger NShrstof fe modifizieren kann. Diese Anderungen 
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der Membranfluiditat kannen auch die Integritat der Zelle ent- 
scheidend beeinflussen; Zellen mit vergleichsweise schwScheren 
Membranen sind anfcLlliger- gegentoer abiotischen und biotischen 
Stressbedingungen, welche die Zelle beschadigen oder abtoten 
5 konnen. Durch Manipulieren von Desaturasen, die an der Produktion 
von Fettsauren und Lipiden ftir den Membranaufbau beteiligt sind, 
so dass die resultierende Meinbran eine Membranzusammensetzung 
hat, die fur die in den Kulturen, die zur Produktion von Fein- 
chemikalien verwendet werden, herrschenden Umweitfaedingungen 
10 empfSnglicher sind, sollte ein groSerer Anteil der Zellen tiber- 
leben und sich vennehren. GroSere Mengen an produzierenden 
Zellen soil ten sich in grofieren Ausbeuten, hoherer Produktion 
Oder Effizienz der Produktion der Feinchemikalie aus der Kultur 
manifestieren . 

IS 

Die vorstehend genannten Mutageneses trategien fiir Desaturasen, 
die zu erhohten Ausbeuten einer Feinchemikalie fiihren sollen, 
sollen nicht beschr&ikend sein; Variationen dieser Strategien 
sind dem Fachmann leicht ersichtlich. Unter Verwendoing dieser 

20 Mechanismen und mithilfe der hier offenbarten Mechanismen kdnnen 
die erf indungsgemaSen Nukleinsaure- und Proteinmolekiile zur 
Erzeugung von Algen, . Ciliaten, Pflanzen, Tieren, Pilzen oder 
andefen Mikroorganismen, wie C. glutamicum, verwendet warden, 
die mutierte Desaturase-Nukleinsaure- und Proteinniolekule expri- 

25 mieren, so dass die Ausbeute, Produktion und/oder Effizienz der 
Produktion einer gewUnschten Verbindung verbessert wird. Diese 
gewiinschte Verbindung kann ein beliebiges nat-Qrliches Produkt von 
Algen, Ciliaten, Pflanzen, Tieren,- Pilzen oder Bakterien sein, 
welches die Endprodukte von Biosynthesewegen und Zwischenprodukte 

30 natiirlich vorkoimnender Stoffwechselwege umfasst, sowie MolekQle, 
die im Stoffwechsel dieser Zellen nicht natiirlich vorkonunen, die 
jedoch von den erf indungsgema&en Zellen produziert werden. 

Eine weitere erfindungsgemSEe Aus fUhnmgs form ist ein Verfahren 
35 zur Produktion von PUFAs, wobei das Verfahren das Zuchten 

eines Organismus, der eine erfindimgsgemaSe Nukleins^ure, ein 
erf indungsgemaSes Genkonstrukt oder einen erf indungsgemaSen 
Vektor umfasst, welche ein Polypeptid kodieren, das Cia-, C2o~ 
Oder C22-Fettsauren mit mindestens zwei Doppelbindungen ira 
40 Fettsauremolakiil urn mindestens zwei Kohlenstof fatome unter 
Bedingungen, unter denen PUFAs in dem Organismus produziert 
werden, verlSngert, umfasst. Durch dieses Verfahren hergestellte 
PUFAs lassen sich durch Ernten der Organismen entweder aus 
der Kultur, in der sie wachsen, oder von dem Feld, Aufbrechen 
45 und/oder Extrahieren des geernteten Materials mit einem 

organischen Losungsmittel isolieren. Aus diesem L6sungsmittel 
kann das 6l, das Lipide, Phospholipide, Sphingolipide, Glyco- 
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lipids, Triacyl glycerine und/oder freie Fettsauren mit hoherem 
Gehalt an PUFAs enthalt, isoliert werden. Durch basische oder 
saure Hydrolyse der Lipide, Phospholipide, Sphingolipide, Glyco- 
lipide, Triacyl glycerine kormen die freien Fettsauren mit hoherem 
5 Gehalt an PUFAs isoliert werden. Ein hoherer Gehalt an PUFAs 
bedeutet mindestens 5 %, vorzugsweise 10 %, besonders bevorzugt 
20 ganz besonders bevorzugt 40 % itiehr PUFAs als der ursprtlng- 
liche Organismus, der keine zusatzliche Nukleinsture, die die 
erfindiingsgemaEe Desaturase kodiert, besitzt. 

10 

Vorzugsweise sind die durch dieses Verfahren produzierten PUFAs 
Ci8- oder C20-22"^®ttsSuremolekiile mit mindestens zwei Doppel- 
bindungen im Fettsauretnolekiil , vorzugsweise drei, vier, bei 
Kombination mit einer weitieren Elongasen ^md einer A-4 Desaturase 
15 fiinf Oder sechs Doppelbindungen. Diese Cia- oder C2o-22-Fettsaure- 
molekiile lassen sich aus dem Organismus in Form eines Ols, Lipids 
Oder einer freien FettsMure isolieren. Geeignete Organismen sind 
beispielsweise die vorstehend erwahnten, Bevorzugte Organismen 
sind transgene Pflanzen. 

20 

Eine erf indungsgemafie Ausfuhrxmgsf orm sind Ole, Lipide oder Fett- 
sauren Oder Fraktionen davon^ die durch das oben beschriebene 
Verfahren hergestellt word^ sind, besonders bevorzugt Ql, Lipid 
oder eine Fettsaurezusammensetzung, die PUFAs umfassen und von 
25 transgenen Pflanzen herriihren. 

Eine weitere erf indungsgemaSe Aus fOhrungs form ist die Verwendung 
des 01s, Lipids oder der Fettsaurezusammensetzung in Futter- 
mitteln, Nahrungsmitteln, Kosmetika oder Pharmazeutika. 

30 

Ein weiterer Erfindungsgegenstand ist ein Verfahren zur 
Identifikation eines Antagonisten oder Agonisten von Desaturasen, 
ttmf assend 

35 a) in Kontaktbringen der Zellen, die das Polypeptid der 

vorliegenden Erfindung exprimieren, mit einem Kandidaten- 
stoff ; 

b) Testen der Desaturaseaktivitclt ; 

40 

c) Vergleichen der Desatutaseaktivitat mit einer Standard- 
aktivitat in Abwesenheit des Kandidatenstof fs, wobei ein 
Anstieg der Desaturaseaktivitat liber den Standard anzeigt, 
daiS der Kandidatenstof f ein Agonist und ein Verringerung 

45 der DesaturaseaktivitMt anzeigt, daS der Kandidatenstof f 

ein Antagonist ist. 
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Der genannte Kandidatenstof f karrn ein chemisch synthetisierter 
Oder mikrobiologisch produzierter Stoff sein und z.B. in Zell- 
extrakten von z.B. Pflanzen, Tieren oder Mikroorganismen auf- 
treten. Weiterhin kaim der genannte Stoff zwar im Stand der 
5 Technik bekannt sein, aher bisher nicht bekannt sein als die 
Aktivitat der Desaturasen steigemd oder repremierend. Das Reak- 
tionsgemisch kaxui ein zellfreier Extrakt sein oder eine Zelle 
Oder Zellkultur lunfassen. Geeignete Methoden sind dem Fachmann 
bekannt und werden z.B. allgemein beschrieben in Alberts, Mole- 
10 cular Biology the cell, 3^^ Edition (1994), z.B. Kapitel 17. Die 
genannten Stoff e kdnnen z.B. zu dem Reaktionsgemisch oder dem 
Kulturmedium zugegeben werden oder den Zellen injiziert werden 
Oder auf eine Pflanze gespriiht werden. 

15 Wenn eine Probe, die ein nach der erfindungsgem&i^en Methode 

aktiven Stoff beinhaltet, identif iziert wurde, dann ist es ent- 
weder iti5glich, den Stoff direkt von der ursprtinglichen Probe zu 
isolieren oder man kann die Probe in verschiedene Gruppen teilen, 
z.B. wenn sie aus einer Vielzahl von verschiedenen Komponenten 

20 besteht, um so die Zahl der verschiedenen Siibstanzen pro Probe 
zu reduzieren und dann das erf indungsgemafie Verfahren mit einer 
solchen *'Unterprobe" der ursprtlnglichen Probe zu wiederholen. 
AbhSngig von der Komplexitat der Probe konnen die oben beschrie- 
benen Schritte mehnnals wiederholt werden, vorzugsweise bis die 

25 gemaiS der erfindungsgemaEen Methode identifizierte Probe nur noch 
eine geringe Anzahl von Substanzen oder nur noch eine Substanz 
umfafit. Vorzugsweise wird der gemaE der erf indungsgemaSen Methode 
identifizierte Stoff oder Derivate davon weiter formuliert, so, 
daE er fur die Anwendung in der Pf lanzenzuchtung oder Pflanzen- 

30 zell- oder Gewebekultur geeignet ist. 

Die Stoff e, die gemaS dem erf indungsgemSfien Verfahren getestet 
xuid identifiziert wurden, konnen sein: Express ionsbibliotheken, 
z.B. cDNA-Expressionsbibliotheken, Peptide, Proteine, Nukleins^u- 

35 ren, Antikdrper, kleine organische Stoff e, Hormone, PNAs oder 
ahnliches (Milner, Nature Medicin 1 (1995), 879-880; Hupp, Cell. 
83 (1995), 237-245; Gibbs, Cell. 79 (1994), 193-198 und darin 
zitierte Ref erenzen) . Diese Stof f e kSnne auch funktionelle 
Derivate oder Analogon der bekannten' Inhibitor en oder Aktivatoren 

40 sein. Verfahren zur Herstelltuig von chemischen Derivaten oder 
Analogon sind dem Fachmann bekannt . Die genannten Derivate und 
Analogon konnen gemSfi Verfahren nach- dem Stand der Technik 
getestet werden. Weiterhin kann computergestutztes Design oder 
Peptidomimetics zur Herstellung geeigneter Derivate und Analogon 

45 verwendet werden. Die Zelle oder das Gewebe, die/das fiir das 
erfindungsgemaSe Verfahren verwendet werden ksuin, ist vorzugs- 
weise eine erf indungsgemaEe Wirtszelle, Pflanzenzelle oder ein 
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Pflanzengewebe, wie in den oben genannten Ausfiihrangsformen 
beschrieben. 

Entsprechend betrifft die vorliegende Erfindung auch einen 
5 Stoff, der gemaS den vorstehenden erf indungsgemafien Verfahren 
identifiziert wurde. Der Stoff ist z.B. ein Homolog der 
erfirxdungsgemafSen Desatiirasen. Homologe der Desaturasen konnen 
durch Mutagenese, z.B. durch Punktmutation oder Deletion der 
Desaturasen, erzeugt werden. Hierin verwendet wird der Begriff 

10 "Homolog" als eine variante Form der Desaturasen, die als Agonist 
Oder Antagonist fiir die Aktivitat der Desaturasen wirkt. Ein 
Agonist kann die im wesentlichen gleiche oder einen Tail der 
biologischen Aktivitat der Desaturasen haben. Ein Antagonist der 
Desaturasen kann eine oder mehr Aktivitat en der naturlich vor- 

15 kommenden Formen der Desaturasen inMbieren, z.B. kompetitiv an 
ein Downstream od^r Upstream gelegenes Mitglied der Fettsaure- 
synthese-Stof fwechselwege, die die Desaturasen einschlieSen, 
binden oder an Desaturasen binden und dabei die Aktivitat 
reduzieren oder inhibieren. 

20 

Aufierdem betrifft die vorliegende Erfindung auch ein Antikorper 
Oder ein Fragment davon, wie sie hierin beschrieben werden, der 
die Aktivitat der erf indungsgeiaaSen Desaturasen inhibiert. 

25 Bei einem Aspekt betrifft die vorliegende Erfindung ein Anti- 
korper, der spezifisch den erfindungsgemafien oben beschriebenen 
Agonisten oder Antagonisten erkennt bzw. bindet. 

Ein weiterer Aspekt betrifft eine Zusammensetzung, die den Anti- 
30 kSrper, den nach dem erf indungsgemMfien Verfahren identifiziert en 
Stopp oder das Antisense-Molekiil umfafit. 

In einer weiteren Ausfuhrungsform betrifft die vorliegende . 
Erfindung ein Kit, umfassend die erfindiingsgemaSe Nukleinsaur e , 

35 das erfindungsgemaSe Genkonstrukt, die erfindungsgemaSe Amiho- 
sauresequenz, das erf indungsgemSfee Antisense-NukleinsMuremolekul, 
den erfindungsgemaiSen Antikorper ixnd/oder Zusammensetzung, einen 
Antagonisten oder Agonisten, der nach dem erf indungsgemSSen Ver- 
fahren hergestellt wurde, und/oder erf indungsgemaJSe Ole,. Lipide 

40 und/oder Fettsauren oder eine Fraktion davon, Ebenso kann das 
Kit die erfind\ingsgema£en Wirtszellen, Organismen, Pflanzen 
oder Telle davon, emtbare Tetle der erf indungsgemSfien Pflalizen 
oder Vermehrungsmaterial oder aber auch den erfindungsgeraaisien 
Antagonisten oder Agonisten umfassen. Die Komponenten des Kits 

45 der vorliegenden Erfindung kcinnen in geeigneten Containem, bei- 
spielsweise mit oder in Puf fern oder anderen Losungen verpackt 
sein. Ein oder mehr der genannten Komponenten kSnnen in ein und 
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demselben Container verpackt sein. ZusSltzlich oder alternativ 
kdnnen ein oder mehr der genannten Komponenten z.B. auf einer 
festen Oberflache adsorbiert sein, z.B. Nitrozellulosef ilter, 
Glasplatten, Chips, Nylonmembranen oder Mikrotiterplatten. Das 
5 Kit kann fiir jede der hierin beschriebenen Methoden und Aus- 
ftlhrungsfonnen verwendet werden, z.B. fiir die Produktion von 
Wirtszellen, tremsgenen Pflanzen, zur Detektion von homologen 
Sequenzen, zur Identif ikation von Antagonisten oder Agonisten 
usw. Weiterhin kann das Kit Anleitiingen fUr die Verwendung des 
10 Kits fiir eine der genannten Anwend\ingen enthalten. 

Diese Erfindung wird durch die nachstehenden Beispiele weiter 
veranschaulicht, die nicht als beschrankend aufgefafit werden 
sollten. Der Inhalt samtlicher in dieser Patentanmeldung 
IS zitierten Li teraturst alien, Patentanmeldxingen, Patente und 
verof fentlichten Patentanmeldungen ist hier durch Bezugnahme 
aufgenoinmen. 

Beispielteil 

20 

Beispiel 1: Allgemeine Verfahren 

a) Allgeiueine Klonicrungsverfahren: 

25 Klonierungs verfahren, wie beispielsweise Restriktionsspaltungen, 
Agarosegelelektrophorese, Reinigung von DNA-Fragmenten, Transfer 
von Nukleinsauren auf Nitrocellulose- und Nylonmembranen, 
Verbindung von DNA-Fragmenten, Transformation von Escherichia 
coli- und Hefe-Zellen, Anzucht von Bakterien und Sequenz analyse 

30 rekombinanter DNA, wurden durchgeftlhrt wie beschrieben in 
Saicibrook et al. (1989) (Cold Spring Harbor Laboratory Press: 
ISBN 0-87969-309-6) oder Kaiser, Michaelis und Mitchell (1994) 
"Methods in Yeast Genetics" (Cold Spring Harbor Laboratory Press 
ISBN 0-87969-451-3) . Die Transformation und Anzucht von Algen, 

35 wie Chlorella oder Phaeodactylum werden durchgefuhrt wie be- 
schrieben von El~Sheekh (1999), Biologia Plantarum 42:209-216; 
Apt et al. (1996) Molecular and General Genetics 252 (5):872-9. 

b) Chemikalien 

40 

Die verwendeten Chemikalien wurden, wenn im Text nicht anders 
angegeben, in p. A.-Qualitat von den Firmen Fluka (Neu-Ulin) , 
Merck (Da2nnstadt) , Roth (Karlsruhe), Serva (Heidelberg) und 
Sigma (Deisenhof en) bezogen. LSsungen wurden unter Verwendung 
45 von reinem pyrogenfreiem Wasser, im nachstehenden Text als HjO 
bezeichnet, aus einer* Milli-Q-Wassersystem-Wasserreinigungs- 
anlage (Millipore, Eschbom) hergestellt, Restriktionsendo^ 
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nukleasen, DNA-modif izierende Enzyme und molekularbiologische 
Kits wurden bezogen von den Firmen AGS (Heidelberg) , Amersham 
(Braunschweig) , Biometra (G6ttingen) , Boehringer (Mannheim) , 
Genomed (Bad Oeynhausen) , New England Biolabs (Schwalbach/ 

5 Taunus) , Novagen (Madison, Wisconsin, USA) , Perkin-Elmer 
(Weiterstadt) , Pharmacia (Freiburg) , Qiagen (Hilden) und 
Stratagene (Amsterdam, Niederlande) . Wenn nicht anders ange- 

. geben, wurden sie nach den Anweisungen des Herstellers ver- 
wendet. 

10 

c) Zellmaterial 

Die erfindoangsgemaSen isolierten Nukleinsauresequenzen sind im 
Genom eines Phaeodactylum tricomutum UTEX646-Stainm€S enthalten, 
15 der tiber die Algensammlung der University of Texas, Austin ver- 
ftlgbar ist. 

Phaeodactylum tricomutum wurde bei 2S^Q mit einem Licht/Dunkel 
Rhythmus von 14:10 Stunden bei 22°C und 35 microEinstein (ent- 
20 spricht microitiol Photonen pro Quadratmeter und Sekunde) in Glas- 
rohren kultiviert, die von unten mit Luft begast wurden. 

Als Kulturmedium fiir Phaeodactylum tricomutum wurde das f/2 
Kulturmedium mit 10 % organischen Medium nach Guillard, R»R.L. 
25 verwendet (1975; Culture of phytoplankton for feeding marine 
invertebrates. In: Smith, W.L. and Chanley, M.H. (Eds.) Culture 
of marine Invertebrate animals, NY Plenum Press, pp, 29-60.): 
Es enthalt 

30 995,5 ml Seewasser (artifiziell) 

1 ml NaN03 (75 g/1) , 1 ml NaH2P04 (5 g/1) , 1 ml Spurenelemente- 
losung, 1 irJ. Tris/Cl pH 8.0, 0.5 ml f/2 Vitaminlosiing 

Spurenelementeldsiing: Na2EDTA (4,36 g/1), FeCls (3,15 g/1), 
35 PrimSre Spurenelemente : CuS04 (10 g/1), ZnS04 (22 g/1), C0CI2 
(10 g/1), MnCl2 (18 g/1), NaMo04 (6,3 g/1) 

f/2 VitaminlSsung: Biotin: 10 mg/1. Thiamin 200 mg/1, Vit B12 
0,1 mg/1 

org-Medium: Na-Acetat (1 g/1), Glucose (6 g/1), Na-Succinat 
40 (3 g/1), Bacto-Trypton (4 g/1), Hefe-Extrakt (2 g/1) 



45 
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Beispiel: 2 Isolierung von Gesaiat-DNA aus Phaeodactyliim tri- 
comutvrai UTEX646 ftir Hybridisieimngsexperiinente 

Die EinzeltLeiten der Isolierung von Gesamt-DNA betref fen die Auf- 
5 arbeitung von Pflanzenmaterial mit einem Frischgewicht von einem 
Gramia, 

CTAB-Puffer: 2 % (Gew./Vol.) N-Acetyl-N,N;N-triinethylainmonium- 
bromid (CTAB) ; 100 inM Tris-HCl, pH 8,0; 1,4 M NaCl; 20 mM EDTA. 

10 

N-Laurylsarkosin-Puffer: 10 % (Gew./Vol.) N-Laurylsarkosin; 
100 mM Tris-HCl, pH 8,0; 20 mM EDTA. 

Phaeodactylum tricornutuin-2ellmaterial wurde unter flQssigem 

15 Stickstof f in einem M6rser verrieben, so dass ein feines Pulver 
erhalten wurde, und in 2 ml-Eppendorfgef afie uberftihrt. Das ge- 
frorene Pf lanzenmaterial wurde dann mit einer Schicht von 1 ml 
Zersetziingspuffer (1 ml CTAB-Puffer, 100 ml N-Laurylsarkosin- 
Puffer, 20 ml fi-Mercaptoethanol und 10 ml Proteinase K-L6sung, 

20 10 mg/ml) uberschichtet und eine Stunde unter kontinuierlichem 
Schiitteln bei 60°C inkubiert. Das erhaltene Homogenat wurde 
in zwei EppendorfgefaiSe (2 ml) aufgeteilt und zweimal durch 
SchUtteln mit dem gleichen Volmen Chloroform/Isoamylalkohol 
(24:1) extrahiert. Zur Phasentrennung wurde eine Zentrifugation 

25 bei 8000 x g und RT (= Raumtemperatur = - 23°C) jeweils 15 min 
lang durchgef tlhrt . Die DNA wurde dann 30 min unter Verwend\ing von 
eiskaltem Isopropanol bei -70 °C gefallt. Die gefSllte DNA wurde 
bei 10000 g 30 min bei 4°C sediinentiert und in 180 ml TE-Puffer 
(Sambrook et al., 1989, Cold Spring Harbor Laboratory Press: ISBN 

30 0-87969-309-6) resuspendiert . Zur weiteren Reinigung wurde die 
DNA mit NaCl (1,2 M Endkonzentration) behandelt und erneut 30 min 
unter Verwendung des zweifachen Volumens an absolutem Ethanol bei 
-70°C gefallt. Nach einem Waschachritt mit 70 % Ethanol wurde die 
DNA getrocknet und anschliefiend in 50 ml H2O + RNAse (50 mg/ml 

35 Endkonzentration) aufgenommen. Die DNA wurde iiber Nacht bei 4°C 
gelost und die RNAse-Spaltung wurde cinschlieiSend 1 Std. bei 
37''C durchgef uhrt . Die Aufbewahrung der DNA erfolgte bei 4°C. 

Beispiel 3: Isolierung von Gesamt-RNA und poly(A)+-RNA aus 
40 Pflanzen und Phaeodactylum tricomutum 

Die Isoliemmg von Gesamt-RNA aus Pflanzen wie Lein und Raps 
etc. erfolgt nach einer bei Logemann et al beschriebenen 
Methode (1987, Anal. Biochem. 163, 21) isoliert. Aus Moos kann 
45 die Gesamt-RNA Protonema-Gewebe nach dem GTC*Ver£ahren (Reski 
et al., 1994, Mol. Gen. Genet., 244:352-359) gewoimen werden. 
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RNA Isolierung aus Phaeodactylum tricornutum: 

Tiefgefrorene Algenproben {- 70^0 warden in einem eiskaltem 
Morser xxnter Pliissigstickstof f zu f einem Pulver zerreiben. 
5 2 Voliimen Hoinogenisationsmedium {12,024 g Sorbitol, 40,0 ml IM 
Tris-HCl, pH 9 (0,2 M) ? 12,0 ml 5 M NaCl (0,3 M) , 8,0 ml 250 itiM 
EDTA, 761,0 mg EGTA, 40,0 ml 10 % SDS wurden auf 200 ml mit H2O 
aufgefullt und der pH auf 8,5 eingestellt) und 4 Volumen Phenol 
mit 0,2 % Mercaptoethanol wurden bei 40 bis 50°C unter gutem 
10 Mischen zu gefrorenem Zellpulver gegeben- Danach wurden 2 Volumen 
Chloroform hinzufiigen und fttr 15 min krSftig gertlhrt. Es wurde 
10 min bei 10000 g zentrifugiert und die wassrige Phase mit 
Phenol/Chloroform (2 Vol) \md abschlieSend mit Chloroform 
extrahiert . 

IS 

Das erhaltene Volumen der wassrigen Phase wurde mit 1/20 Vol 
4 M Na-Acetat (pH 6) und 1 Vol Isopropanol (eiskalt) versetzet 
und die NukleinsSuren bei -20<^C Ober Nacht (= tJN) gefailt. 
AnschlieSend wurde 30 min bei 10000 g zentrifugiert und der 

20 Uberstand abgesogen. Es folgte ein Waschschritt mit 70 % EtOH 
und erneute Zentrifugation. Das Sediment wurde in Tris-Borat- 
Puffer. (80 mM Tris-Borat-Puf f er, 10 mM EDTA, pH 7,0) aufgenoramen. 
Dann wurde der Oberstand mit 1/3 Vol 8 M LiCl versetzt, gemischt 
30 min bei 4°C inkubiert. Nach erneutem zentrifugieren wurde 

25 das Sediment mit 70 % Ethanol gewaschen, zentrifugiert und das 
Sediment in RNAse-freiem Wasser gelost. 

Die IsolieruJig von poly (A) +-Rt!lA erfolgte unter Verwendung von Dyna 
Beads® (Dynal, Oslo, Finnland) nach den Anweisungen im Protokoll 
30 des Herstellers. 

Nach der Bestimmung der RNA- oder poly (A) +-RNA-Konzeiitration wurde 
die RNA durch Zugabe von 1/10 Volumina 3 M Natriumacetat, pH 4,6, 
und 2 Volumina Ethanol gefailt und bei -70**C aufbewahrt. 

35 

Fur die Analyse wurden jeweils 20 lig RNA in einem Formaldehyd- 
haltigen l,5%igen Agarosegel aufgetrennt und auf Nylon 
Membranen (Hybond, Amersham) OberftLhrt. Der Nachweis spezifischer 
Transkripte vmrde wis bei Amasino beschrieben durchgefiihrt 
40 ((1986) Anal. Biochem. 152, 304)). 

Beispiel 4: Konstruktion der cDNA-Bank 

Zur Konstruktion der cDNA-Bank aus Phaeodactylum tricornutum 
45 wurde die Brststrangsyn these unter Verwendung von Reverser 
Translcriptase aus Maus-Leuk&nie-Virus (Roche, Mannheim, 
Deutschland) und 01igo-d(T)-Primem, die Zweitstrangsynthese 
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durch Inkubation mit DNA- Polymerase I, Klenow-Enzyiti iind HNAse 
H-Spaltung bei'l2**C (2 Std.), 16^C (1 Std.) und 22°C (1 STd. ) 
erzielt. Die Reaktion wurde durch Inkubation bei 65*C (10 min) 
gestoppt und anschlieSend auf Eis iiberfiihrt. Doppelstrangige DNA- 
5 Molekiile wurde mit T4-DNA-PolyiTLerase (Roche, Mannheim) bei SV'C 
(30 min) mit glatten Enden versehen. Die Nukleotide wurden durch 
Phenol/Chloroform-Extraktion und Sephadex-GSO-ZentrifugiersSulen 
entfernt. EcoRI/XhoI-Adapter (Pharmacia, Freiburg, Deutschland) 
wurden mittels T4-DNA-Ligase (Roche, 12°C, uber Nacht) an die 

10 cDNA-Enden ligiert, mit Xhol nachgeschnitten und durch Inkubation 
mit Polynukleotidkinase (Roche, 37®C, 30 min) phosphoryliert . 
Dieses Gemisch wurde der Trennung auf einem Low-Mel ting-Agarose- 
Gel unterworfen. DNA-Molekule lifcer 300 Basenpaaren wurden aus dem 
Gel eluiert, Phenol-extrahiert/ auf Elutip-D-Saulen (Schleicher 

15 und Schiill/ Dassel, Deutschland) konzentriert und an Vektorarme 
ligiert und in lambda-ZAP-Express-Phagen unter Verwendung des 
Gigapack Gold-Kits (Stratagene, Amsterdam, Niederlande) verpackt, 
wobei Material des Herstellers verwendet und seine Anweisungen 
befolgt wurden. 

20 

Beispiel 5: DNA-Seguenzierung xmd Computeranalyse 

cDNA-Banken, wie im Beispiel 4 beschrieben, wurden zur DNA- 
Sequenzierung nach Standardverf ahren, insbesondere durch das 

25 Kettenterminationsverfahren unter Verwendung des ABI PRISM Big 
Dye Terminator Cycle Sequencing Ready Reaction-Kit (Perkin- 
Elmer, Weiterstadt, Deutschland), verwendet. Die Seguenzierung 
zufalliger, vereinzelter Klone wurde anschlieSend an die 
praparative Plasmidgewinnung aus cDNA-Banken iiber in vivo-Massen- 

30 excision \ind Re trans format ion von DHIOB auf Agarplatten durch- 
gefiihrt (Einzelheiten zu Material und Protokoll von Stratagene, 
Amsterdam, Niederlande) , Plasmid-DNA wurde aus xiber Nacht 
geziichteten E. cpli-Kulturen, die in Luria-BrUhe mit Ampicillin 
(siehe Sambrook et al. (1989) (Cold Spring Harbor Laboratory 

35 Press: ISBN 0-87969-309-6)) gezlichtet worden waren, an einem 
Qiagen-DNA-PrSparat ions-Robot er (Qiagen, Hilden) nach den 
Protokollen des Herstellers prSpariert. Sequenzierpriraer mit 
den folgenden Nukleotidsequenzen wurden verwendet: 

40 5 ' -CAGGAAACAGCTATGACC-3 ' 

5 ' -CTAAAGGGAACAAAAGCTG-3 ' * 
5 ' -TGTAAAACGACGGCCAGT-3 ' 

Die Sequenzen wurden unter Verwendung des Standard-Sof twarepa- 
45 kets EST-MAX, das kommerziell von Bio-Max (Miinchen, Deutschland) 
geliefert wird, prozessiert und annotiert. Durch Nutzung von 
Vergleichsalgorithmen und unter Verwendung der in SEQ ID NO: 8 



wo 02/057464 



PCT/EP02/00461 



79 

dargestellten Suchsequenz wurde mithilfe des BLAST-Programms nach 
homologen Genen gesuctit (Altschul et al. (1997) "Gapped BLAST and 
PSI-BLAST: a new generation of protein database search programs", 
Nucleic Acids Res. 25:3389-3402.). Zwei Sequenzen aus Phaeo- 
5 dactylum tricornutum mit Homologien zur Suchsequenz aus Physco^ 
mitrella patens vairden eingehender charakterisiert . 

Beispiel 5a: Isolation von Desaturasen aus Phaeodactylum tri- 
comutum uber Polymerase Kettenreaktion mithilfe 
10 degenerierter Oligonukleotide: 

Mithilfe von publizierten Desaturasen kSnnen Motive identif iziert 
werden, die filr A-5 und A-6 Desaturasen typisch sind. Im folgen- 
den sind Oligonukleotidsequenzen mit mdglichen Variationen dar- 

15 gestellt. Unter der Oligonukleotidsequenz ist im Ein-Buchstaben- 
code die Aminosaure dargestellt, von der die Basenkoitibination 
abgeleitet werden kann. Z.B. bedeutet A/G, daS an dieser Position 
bei der Synthase des Bausteins statistisch gleichverteilt ent- 
weder ein A oder ein G in das Oligonukleotid eingebaut wird, 

20 da das von der korrespondierenden Aminosaure abgeleitete Basen-- 
triplett entweder ein AAA oder ein AAG sein kann. Die DNA Sequenz 
kann auch ein Inosin (i) enthalten, wenn die Bestiiraciung einer 
Base an dieser Position aufgrund des genetischen Codes drei 
Oder vier unter schiedliche Basen erlaubt. Folgende Sequenzen 

25 und Primer konnen verwendet werden: 



5 ' -Vorwarts- Primer : 





Fla: 


TGG 


TGG 


AA A/G 


TGG 


AAi 


CA T/C AA 






Fib: 


TOG 


TGG 


AA A/G 


TGG 


ACi 


CA T/C AA 




30 


Fla: 


W 


W 


K 


W 


N/T 


H K/N 






Fib: 


W 


W 


K 


W 


K 


H ^ K/N 






F2a: 


Gi 


TGG 


AA A/G 


GAi 


A/C Ai 


CA T/C AA 






F2b: 


Gi 


TGG 


AA A/G 


TTG 


A/C Ai 


CA T/C AA 




35 


F2a: 


G/W 


W 


K 


E/D 


K/Q/N 


H K/N 






F2b: 


G/W 


W 


K 


W 


K/Q/N 


H K/N 






F3a: 


T A/T i 


TTG 


AAi 


A/C A 


A/G C/A G/A i 


CA 




F3b: 


T A/T i 


TTG 


AAi 


A/C A 


A/G CAi 


CA 




F3a: 


W 




W 


K/N 


H/N 


R/Q 


H 


40 


F3b: 


Y 




w 


K/N 


H/N 


. -R/Q 


H 




F4a: 




GTi TGG A A/T G/A GA A/G CA A/G CA 




F4b: 




GTi TGG A A/T G/A A/T A T/C CA A/G CA 




F4a: 




V 


w 


K/M 


E 


Q 


H 




F4b: 




V 


w 


K/M 


N/Y Q 


H 


45 


F5al: 




CA 


T/C TA T/C 


TGG AA A/G AA T/C CA G 


C 




F5al: 




CA T/C TA T/C 


TGG AA A/G AA T/C CA A 


C 




F5al: 




H 




Y 


W K 


N Q 


H/ 
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F6a: TTG TTG AAi A/C A A/G AA i CA T/C AA 

F6a: W W K/N H/N K/N H K/N 



3'- Reverse Primer 



5 Rib: GG A/G AA 

Rib: GG A/G AA 

Rla: P F 

Rib: P F 

R2al: AA iAG 

10 R2a2: AA T/C AA 

R2al : F L 

R3al: AT iTG 

R3a2: AT A/G TT 

R3a3: AT iTG 
15 R3a4: . AT A/G TT 

R3al: I/M H/Q 

R3a2: I/M N 

R4al: CT 

R4a2 : OA 
20 R4a3: GT 

R4al: = T/R/S 

R5al: AA iAA 

R5a2: AA iAG 

R5al: F F H 

25 R5a2: F L H 

R6al: T iGG iA A/G 

R6al: T iGG iA A/G 

R6al: T/N P L 



H EI „ 

H E I Q , 

iAA A/G TG A/G TG iAC 

iAG A/G TG A/G TG iAC 
F/L H H V 



iAG G/A TG G/A TG T/C TC 
iAA G/A TG G/A TG T/C TC 
L H H E 

' F H H E 

A/G TG A/G TG iA C/T iA/G T/C TG 
A/G TG A/G TG iA C/T iA/G T/C TG 

H H V/I V/A Q 

iGG A/G AA iAA A/G TG A/G TG 
iGG A/G AA iAA A/G TG A/G TG 
iGG A/G AA iAG A/G TG A/G TG 
iGG A/G AA iAG A/G TG A/G TG 
P F F H H 

P F L H H 

iGG A/G AA iA A/G A/G TG A/G TG 

iGG A/G AA iA A/G A/G TG A/G TG 

iGG A/G AA iA A/G A/G TG A/G TG 

P F F/L H H 

A/G TG A/G TG T/C TC T/A/G AT T/C TG 

A/G TG A/G TG T/C TC T/A/G AT T/C TG 



3Q Aufgrund verschiedener VariationsmGglichkeiten sind viele 

abgeleitete Oligonukleotide moglich, jedoch OberraschendGrweise 
gefimden wiirde, dass dargest elite Oligonukleotide besonders zur 
Isolation von Desaturasen geeignet sein kSnnen. 

32 Die Primer konnen in alien Kombinationen ftir Polymerase Ketten- 
reaktionen eingesetzt werden. Mithilfe einzelner Kombinationen 
konnten Desaturase-Fragmente isoliert, wenn nachfolgende 
Bedingungen berucksichtigt warden: FUr PCR Reaktionen warden 
jeweils 10 nMol Primer und 10 ng einer durch in vivo Excision 
gewonnenen Plasmidbank eingesetzt. Die Plasmidbank konnte nach 
Protokollen des Hers tellers (Stratagene) aus der Phagenbank 
isoliert werden. Die PCR-Reaktion wurde in einem Thermocycler 
(Biometra) mit der Pfu-DNA-Polymerase (Stratagene) xmd dem 
folgenden Temperaturprogramm durchgef lihrt : 3 min bei 96^0, gefolgt 

45 von 35 Zyklen mit 30 s bei 96oC, 30 s bei SS^C und 1 min bei 72oc. 
Dabei wurde die Anlagerungstemperatur nach dem ersten Schritt von " 
550c schrittweise mn je 3®C erniedrigt und nach dem fxinften Zyklus 
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eine Anlagerungstemperatur -von 40^C beibehalten, Letztlich wurde 
ein Zyklus mit 10 min bei 12^Q durchgefvihrt iind der Ansatz durch 
Kahlen auf 4^0 beendet. 

5 Die Primerkombination F6a und R4a2 sind im Text untsrstrichen 
gekennzeichnet und konnten erfolgreich zur Isoliemng eines 
Desaturasefragmentes genutzt werden. Das resultierende Fragment 
konnte durch Sequenzierung verifiziert werden und zeigte Homo- 
logien zu einer Desaturase mit der Genbank Accession Nr. T36617 

10 aus Streptomyces coelicolor. Die Homologie wurde mithilfe des 
BLASTP Programmes erhalten. Der Vergleich ist in Figur 4 dar- 
gestellt, Es ergaben sich Identitaten von 34 % und eine Homo- 
logie von 43 % zu Sequenz T366i7. Das DNA-Fragment wurde gemafi 
Beispiel 7 in einera Hybridisierungs experiment zur Isoliervmg 

15 eines Voliangengens nach Standardbedingungen erf indungsgemafi 
eingesetzt • 

Die Codierregion einer so isolierten DNA- Sequenz wurde durch 
Ubersetzung des genetischen Codes in eine Polypeptidsequenz 

20 erhalten. In SEQ ID NO: 3 ist eine 1434 Basenpaare lange 

Sequenz dargestellt, die durch beschriebenes Verfahren isoliert 
werden konnte. Die Sequenz besitzt ein Startcodon in Position 1 
bis 3 und ein Stopcodon in Position 1432-1434 und konnte in ein 
477 Aminosauren langes Polypeptid tibersetzt werden. Durch Ver- 

25 gleich mit einer in WO 98 46763 beschriebenen Gensequenz wurde 
gefunden, dass ein nicht identisches aber homologes Fragment 
aus Phaeodactylum tricornutum codierend fiir 87 Aminosauren 
vorbeschrieben wurde. Jedoch offenbart WO 98/46763 weder eine 
vollstandige, fvmktionell aktive Desaturase noch Positions- 

30 Oder Substratspezif iat . Dies wird auch dadurch deutlich, dass 
sowohl Homologien zur A-5, als auch zur A- 6 -Desaturase aus 
Mortierella alpina berichtet werden, ohne eine genaue Funktion 
festzulegen. Die erf indungsgemafie Sequenz hingegen codiert fiir 
eine funktionell aktive A-6-Acyl Lipid Desaturase. 

35 

Beispiel 6: Identif izieorung von DNA Sequenzen codierend fiir 
Desaturasen aus Phaeodactylum tricornutum 

Die Volllangensequenz der A~6-Acyl Lipid Desaturase Pp_des6 
40 AJ222980 (NCBI Genbank Accession Nr.) aus dem Moos Physco- 

mitrella patens (siehe auch Tabelle 1) sowie die A-12-acyl Lipid 
Desat\:irase Sequenz {Tabelle 1 siehe Ma_desl2) aus Mortierella 
alpina AF110509 (AF110509 NCBI Genbank Accession Nr.) wurden 
ftlr Sequenz vergleiche mithilfe des TBLASTN Suchalgorhythmus 
45 eingesetzt. 
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Die EST-Sequenzen PT0010070010R, PT001072031R sowie PT001078032R 
wurden zxinSchst aufgrund schwacher Homologien mit den Such- 
sequenzen aus Physcomitrella und Mortierella xinter v/eiteren 
Kandidatengenen als Zielgen in Betracht gezogen. In Figur 1 und 
5 in Figur 2 sowie Figur 2a ist das Ergcbnis der zv/ei gefundenen 
est-Secjuenzen dargestellt. Die gefundenen Sequenzen sind Teil 
der erfindungsgemafien NukleinsSviren aus SEQ ID NO: 1 (Genname: 
Pt_des5, eigene Datenbank Nr. der Erfinder PT001078032R) , 
SEQ ID NO: 5. (Gexiname: Pt_desl2, eigene Datenbank NR. der 

10 Erfinder PT0010070010R) und SEQ ID NO: 11 (Genname: Pt_desl2,2, 
eigene Datenbank des Erf inders PT001072031R) . Buchstaben zeigen 
identische Aninosauren an, wahrend das Pluszeichen eine chemisch 
ahnliche Aminosaure bedeutet. Die Identitaten bzw. Homologien 
aller erf indungsgemafi gefundener Sequenzen gehen aus Tabelle 2 

15 zusammenfassend hervor. 

Desaturasen kormen Cytochrom b5 Domanen aufweisen, die auch in 
anderen nicht Desaturasen codierenden Genen vorkoininen. Cytochrom 
bS Domanen zeigen mithin hohe Homologien an, obwohl es sich um 

20 verschiedene Genf\mktionen handelt. Desaturasen k5nnen schwach 
konservierter Bereiche lediglich als putative Kandidatengene 
identifiziert werden und m^ssen auf die EnzymaktivitSt und 
Positionsspezif itat der enzymatischen Funktion bin gepr^ift 
werden. Beispielsweise zeigen auch verschiedene Hydroxylasen, 

25 Acetylenasen und Epoxygenasen ahnlich wie Desaturasen Histidin- 
Box Motive, so dass eine konkrete Funktion experimentell nach- 
gewiesen werden muS und zusfitzlich die Verif izierung der Doppel- 
bindung erst eine sichere Enzymaktivitat und Positionsspezif itat 
einer Desaturase ermoglicht. Uberraschenderweise wurde gefunden, 

30 dass erf indungsgeraaEe A-6- imd A-5- Desaturase besonders geeig- 
nete Substratspezif itaten aufweisen und besonders geeignet sind, 
um in Kombination mit einer A-6-Elongase aus Physcomitrella zur 
Produktion von polyunges^ttigten Fettsauren wie ArachidonsSure , 
Eicosapentaensaure und DocosahexaensSvire genutzt werden kdnnen. 

35 

Die Sequenziermig des vollstandigen cDNA Fragmentes aus Klon 
PT001078032R ergab eine 1652 Basenpaare lange Sequenz. Die 
Sequenz codiert far ein Polypeptid von 469 Aminosauren dar- 
gestellt in SEQ ID NO: 2. Diese wurde erhalten durch Uber- 

40 setzung des genetischen Codes aus SEQ ID NO: 1 mit einem Start* 
codon in Basenpaarposition 115-117 xmd mit einem Stopcodon 
in Basenpaarposition 1522-1524. Der Klon beinhaltet ein voll- 
standiges Desaturase-Polypeptid, wie aus dem Sequenzvergleich 
in Figur 3 zu ersehen ist. Striche bedeuten identische Amino- 

45 sauren wahrend Doppelpunkte und Einzelpunkte chemisch aus- 
tauschbare, d.h. chemisch aquivalente Aminosauren darstellen. 
Der Vergleich wurde mit der BLOSUM62 Austauschmatrix tiXr Amino- 
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sauren nach Henikoff & Henikoff durchgefuhrt : ( (1992) Amino acid 
substitution matrices from protein blocks. Proc. Natl. Acad.Sci. 
USA 89: 10915-10919). Verwendete Parameter; Gap Weight: 8; 
Average Match: 2.912, Length Weight: 2, Average Mismatch: -2.003. 

5 

In Figur 6 und Figur 7 ist der Vergleich der MA_desl2 Peptid- 
sequenz mit den gefundenen Sequenzen dargestellt. 

Die Sequenzierung des vollstandigen cDNA Fragmentes aus Klon 
10 PT0010070010R ergab eine in SEQ ID NO: 5 dargestellte 1651 Basen- 
paare lange Sequenz mit einem Startcodon in Position 67-69 und 
einem Stopcodon in Position 1552-1554. Die erf indungsgemaSe Poly- 
petidsequenz ist in SEQ ID NO: 6 dargestellt. 

15 Die Sequenzierung des vollstandigen identifizierten cDJIA 

Fragmentes aus Klon PT0010072031R ergab eine in SEQ ID NO: 11 
dargestellte 1526 Basenpaare lange Sequenz mit einem Startcodon 
in Position 92-94 xind einem Stopcodon in Position 1400-1402. 
Die erfindungsgemafie Polypetidsequenz ist in SEQ ID NO: 12 

20 dargestellt. 

In Tabelle 2 sind die Identitaten und Homologien erfindungs- 
gemaiSer Desaturasen untereinander und mit der Desaturase aus 
Physcomitrella patens und Mortierella alpina dargestellt. Die 

25 Angaben wurden mithilfe des Programms Bestf it unter gegebenen 
Parametem wie unten definiert als Teilprogramin f olgender Soft- 
ware erhalten: Wisconsin Package Version 10.0 (Genetics Computer 
Group (GCG) , Madison, Wise, USA). Henikoff, S. and Henikoff , 
J.G. (1992). Amino acid substitution matrices from protein 

30 blocks. Proc. Natl. Acad. Sci. USA 89: 10915-10919. 

Weiterhin ist in Figiir 5 der Vergleich der A-6-acyl Lipid 
Desaturase aus Physcomitrella patens mit der Polypeptidsequenz 
des Klons Pt_des6 dargestellt. 

35 

Tabelle 2: 



Homologie / 


Suchsequenz 


Suchsequenz 


Identitat in % 


Pp_des6 


Ma_desl2 


Pt_des5 


34.92/26.37 


n.d. 


Pt_des6 


50.69/41.05 


n.d. 


Pt_desl2 


n.d. 


48.58/38.92 


Pt_desl2.2 


n.d. 


48.37/41.60 



n.d. = nicht durchgeftihrt 
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Mithilfe des ALgorhythmus TBLASTN 2.0.10: Altschul et al 1997, 
"Gapped BLAST and PSI-BLAST: a new generation of protein database 
search programs', Nucleic Acids Res. 25:3389-3402 wurden liber 
einen lokalen Datenbankvergleich Sequenzen mit hdchster Sequenz- 
5 hoinologie bzw. Identitat identif iziert . Die Ergebnisse sind in 
folgender Tabelle 2A dargestellt. 

Tabelle 2A: Homologe mit den hochsten Sequenzhomologien bzw 

Identitaten zu erfindvmgsgemtfien Polypeptidsequenzen 



10 


aus SEQ ID NO. 


2, 4/ 6 Oder 


12 






Homologie / 
Identitat {%) 


Suchsequenz 
PT001070010R 


Suchsequenz 
PT001072031R 


Suchsequenz 
PT001078032R 


Suchsequenz 
Pt„des6 


15 


L26296: Fad2 
A. thaliana 


50 % / 37 % 




n.d. 


n.d. 




U86072 Petro- 

selinum 

cri spurn Fad2 


n.d. 


51/40 


n.d. 


n.d. 




AL358652 










20 


ti. major 
putative 
desaturase 


n.d. 


n.d. 


45/30 


n.d. 


25 


AB020032 K. 
alpina delta 
6 desaturase 


n.d. 


n.d. 


n.d. 


53/38 



Beispiel 7: Identif ikation von Genen mittels Hybridisierung 

Gensequenzen lassen sich zur Identif ikation homologer oder 
heterologer Gene aus cDNA- oder genomischen Banken verwenden. 



Homologe Gene (d.h. Voll-LSngen-cDNA-Klone, die homolog sind, 
oder Homologen) lassen sich tiber Nukleinsaurehybridisierung 
unter Verwendung von beispielsweise cDNA-Banken isolieren: Ins- 
besondere zur Isolierxmg von funktionell aktiven Voll-Langengenen 
der in SEQ ID NO: 3 gezeigten kann die Methode genutzt warden. 
Je nach der Haufigkeit des Gens von Interesse werden 100000 bis 
zu lOOOOOQ rekombinante Bakteriophagen plattiert und auf eine 
Nylonmembran iiberfahrt. Nach der Denaturierung mit Alkali wurde 
die DNA auf der Membran z.B. durch UV-Vernetzung immobilisiert . 
Die Hybridisierung erfolgt bei hoch-stringenten Bedingungen. In 
wassriger Losung werden die Hybridisieinang und' die Waschschritte 
bei einer lonenstarke von 1 M NaCl und einer Temperatur von 68**C 
durchgefuhrt . Hybridisierungssonden wurden z.B. durch Markierung 
mittels radioaktiver (32p-) Nicktranskription (High Prime, Roche, 



wo 02/057464 



PCT/EP02/00461 



85 

Mannheim, Deutschland) hergestellt. Die Signals warden mittels 
Autoradiographie nachgewiesen . 

Partiell homologe oder heterologe Gene, die verwandt, aber nicht 
5 identisch sind, lassen sich analog zum oben beschriebenen Ver- 
fahren unter Verwend\ing niedrig-stringenter Hybridisieriings- und 
Waschbedingungen identifizieren. F^r die wassrige Hybridisierung 
wurde die lonenstarke gewohnlich bei 1 M NaCl gehalten, wobei 
die Temperatur nach und nach von 68 auf 42°C gesenkt wurde. 

10 

Die Isolieamng von Gensequenzen, die nur zu einer einzelnen 
Doitiane von beispielsweise 10 bis 20 AminosSuren Homologien auf- 
weisen, lasst sich unter Verwendung synthetischer , radioaktiv 
markierter Oligonukleotidsonden durchfiihren. Radioaktiv markierte 

15 Oligonukleotide warden mittels Phosphorylierung des 5 '-Elides 

zweier komplementarer Oligonuklsotide mit T4-Polynukleotidkinase 
hergestellt. Die komplementaren Oligonukleotide werden aneinander 
hybridisiert und ligiert, so dass Konkatemere entstehen. Die 
doppelstrtngigen Konkatemere werden beispielsweise durch Nick- 

20 transkription radioaktiv markiert. Die Hybridisierung erfolgt 
gewohnlich bei niedrig-stringenten Bedingungen unter Verwendung 
hoher Oligonukleotidkonzentratipnen . 

Oligonukleotid-Hybridisierungsldsung : 

25 

6 X SSC 

0,01 M Natriumphosphat 
1 mM EDTA (pH 8) 
0,5 % SDS 

30 100 mikrog/ml denaturierte Lachssperma-DNA 
0,1 % fettarme Trockenmilch 

Wahrend der Hybridisierxmg wird die Temperatur schrittweise auf 5 
bis 10**C unter die berechnete Oligonukleotid-Tm oder bis auf Ra\m- 

35 temperatur (bedeutet RT = - in alien Experimenten, wenn nicht 

anders angegeben) gesenkt, gefolgt von Waschschritten und Auto- 
radiographie. Das Waschen wird mit extrem niedriger Stringenz 
durchgeftihrt, zim Beispiel 3 Waschschritte unter Verwendung von 
4 X SSC. Weitere Einzelheiten sind wie von Sambrook, J., et al. 

40 (1989), "MolecTOlar Cloning: A Laboratory Manual", Cold Spring 
Harbor Laboratory Press, oder Ausubel, F.M. , et al. (1994) 
"Current Protocols in Molecular Biology", John Wiley & Sons, 
beschrieben. 



45 
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Beispiel 8: Identifikation von Zielgenen durch Sichtung von 
Expressionsbanken mit Antikorpern 

Es wurden cDNA-Sequenzen zur Herstelliing von rekombinantem 
5 Protein zum Beispiel in E. coli verwendet (z.B. Qiagen QIAexpress 
pQE-System) . Die rekoitibinanten Proteins wurden dann gewohnlich 
uber Ni-NTA-Affinitatschromatographie (Qiagen) af finitats- 
gereinigt. Die rekombinanten Proteine wurden dann zur Herstelliing 
spezifischer Antikorper beispielsweise iinter Verwendung von 

10 Standardtechniken zur Immimisierung von Kaninchen vearwendet. 
Anschliefiend wurden die AntikQrper dann unter Verwendung einer 
Ni-NTA-Saule, die mit rekombinantem Antigen vorgesattigt wird^ 
affinitatsgereinigt, wie von Gu et al., (1994) BioTechniques 
17:257-262 beschrieben. Der Antikorper kann dam zur Durch- 

15 musterung von Expressions-cDNA-Banken mittels immunologischem 
Sichtung verwendet werden (Sambrook, J., et al. (1989), 
"Molecular Cloning: A Laboratory Manual", Cold Spring Harbor 
Laboratory Press, oder Ausubel, P.M., et al. (1994) "Current 
Protocols in Molecular Biology'', John Wiley & Sons) . 

20 

Beispiel 9: Transformation von Agrobacterium 

Die Agrobacteriuca-vermittelte Pflanzentrcois formation kaim zum 
Beispiel unter Verwendung des GV3101- (pMP90-) (Koncz und Schell, 
25 Mol. Gen. Genet. 204 (1986) 383-396) oder LBA4404- (Clontech) 
Oder C58C1 pGV2260 (Deblaere et al 1984,. Nucl. Acids Res. 13, 
4777-4788) Agrobacterium tumef aciens-Stamms durchgefuhrt werden. 
Die Transformation kann durch Standard-Transfomationstechniken 
durchgefuhrt werden (ebenfalls Deblaere et al. 1984) . 

30 

Beispiel 10: Pf lanzentransf orroation 

Die Agrobacterium-vermittelte Pflanzentransf ormation kann unter 
Verwendung von Standard-Transformations- \md Regenerations- 

35 techniken durchgefuhrt werden (Gelvin, Stanton B., Schilperoort , 
Robert A., Plant Molecular Biology Manual, 2. Aufl., Dordrecht: 
Kluwer Academic Publ., 1995, in Sect., Ringbuc Zentrale Signatur: 
BTll-P ISBN 0-7923-2731-4; Glick, Bernard R. , Thompson, John E. , 
Methods in Plant Molecular Biology and Biotechnology, Boca Raton: 

40 CRC Press, 1993, 360 S., ISBN 0-8493-5164-2). 

Beispielsweise kann Raps mittels Kotyledonen- oder Hypokotyl- 
transf ormation trajisf ormiert werden (Moloney et al., Plant 
Cell 8 (1989) 238-242; De Block et al., Plant Physiol. 91 (1989) 
45 694-701) . Die Verwendung von Antibiotika far die Agrobacteriuici- 
und Pf lanzenselektion* hSngt von deia fiir die Transformation 
verwendet en binSren Vektor und Agrobacterium-Stamra ab. Die 
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Rapsselektion wird gewolinlich unter Verwendung von Kanamycin 
als selektierbarem Pflanzenmarker durchgef tlhrt . 

Der Agrobacterium-vennittelte Gentransfer in Lein (Liniun 
5 usitatissimum) lasst sich unter Verwendiing von beispielsweise 
einer von Mlynarova et al. (1994) Plant Cell Report 13:282-285 
beschriebenen Technik durchf tihren . 

Die Transformation von Soja kann unter Verwendxing von beispiels- 
10 welse einer in EP-A-0 0424 047 (Pioneer Hi-Bred International) 
Oder in EP-A-0 0397 687, US 5,376,543, US 5,169,770 (University 
Toledo) beschriebenen Technik durchgeflihrt werden. 

Die Pf lanzentransformation unter Verwendung von Teilchen- 
15 beschuss, Polyethylenglycol-verniittelter DNA-Aufnahme oder 
liber die Siliziumcarbonatf aser-Technik ist beispielsweise be- 
schrieben von Freeling und Walbct "The maize handbook" (1993) 
ISBN 3-540-97826-7, Springer Verlag New York). 

20 Beispiel 11: Plasmide fUr die Pf lanzentransforaation 

Geeignete binare Vektoren und Trans forma tionsmarker 

Zur Pfleinzentrans format ion konnen binare Vektoren, wie pBinAR 

(Hofgen und Willmitzer, Plant Science 66 (1990) 221-230) oder 

25 pGPTV (Becker et al. 1992, Plant Mol. Biol, 20:1195-1197) verwen- 
det werden. Die Konstruktion der binSren Vektoren kann durch Li- 
gation der cDlvIA in Sense- oder Antisense-Orientierung in T- 
DNA erfolgen. 5' der cDNA aktiviert ein Pf lanzenpromotor die 
Transkription der cDNA. Eine Polyadenylierungssequenz befindet 

30 sich 3' von der cDNA. Die binSren Vektoren kSnnen unterschiedli- 
che Markergene tragen. So kann etwa die Resistenz durch die Ex- 
pression des nptll Markergens unter Kontrolle des 35S oder des 
nos Promoters erfolgen. Insbesondere kann das nptll-Markergen co- 
dierend fiir Kanamycin-Resistenz vermittelt durch Neomycinphospho- 

35 transferase gegen die herbizidresistente Form eines Acetolactat 
Synthasegens (AHAS oder ALS) ausgetauscht werden. Das ALS-Gen ist 
beschrieben in Ott et al., J. Mol. Biol. 1996, 263:359-360, Geei- 
crnet fiir manche Pf lanzen ist auch die Verwendung des Hygromycin- 
Resistenz-Gens . Der v-ATPase-cl-Promotor kann in das Plasmid 

40 pBinl9 oder pGPTV kloniert werden und durch Klonierung vor die 
kodierende Region des ALS Gens ftir die Markergenexpression ge- 
nutzt werden. Der genannte v-ATPase-cl-Promotor entspricht einem 
1153 Basenpaar fragment aus Beta vulgaris (Plant Mol Biol, 1999> 
39:463-475). Der genannte nos Promoter Dabei konnen sowohl Sul- 

45 phonylhamstof fe als auch Imidazolinone wie Iiaazethapyr oder Sul- 
phonylhamstof fe als Antimetaboliten zur Selektion verwendet wer- 



wo 02/057464 



PCT/EPa2/U0461 



88 

den. Alternativ kann auch der nos-Promoter fiir die Markergenex- 
pression verwendet werden. 

Beispiel 12: Ermittlung von geeigneten Promotoren fur die 
5 Expression in Lein 

Die gewebespezifische Expression ISsst sich unter Verwendung ei- 
nes gewebespezif ischen Promo tors erzielen. Beispiel sweise kann 
die samenspezif ische Expression erreicht werden, indem der DC3- 

10 Oder der LeB4- oder der USP-Promotor oder der Phaseolin-Proitiotor 
5' der cDNA einkloniert wird. Auch jedes andere saaienspezif ische 
Promotorelement wie z.B. der Napin- oder Arcelin Promotor (Goos- 
sens et al. 1999; Plant Phys . 120 (4) : 1095-1103 und Gerhardt et 
al. 2000, Biochimica et Biophysica Acta 1490 (1-2) :87~98) kann 

15 verwendet werden. Zur konstitutiven Expression in der ganzen 
Pflanzen lasst sich der CaMV-35S-Promotor oder ein v-ATPase-cl - 
Promotor verwenden. 

Um die Eigenschaften des Promoters zu bestinmien und die essen- 
20 tiellen Elemente desselben, die seine Gewebespezif itSt ausmachen, 
zu identif izieren, ist es erf orderlich, den Promotor selbst oder 
verschiedene Fragmente desselben vor ein sogenanntes Reportergen 
zu setzen, das eine Bestiiratiung der ExpressionsaktivitSt ermog- 
licht. Beispielhaft fur ein Reportergen sei die bakterielle 
25 IS-Glucuronidase (GUS) genannt (Jefferson et al., EiyCBO J. 1987, 6, 
3901-3907). Die fi--Glucuronidase Aktivitat kann iia-situ mittels 
eines chromogenen Siibst rates wie 5~Bromo-4-Chloro-3-Indolyl- 
IS-D-GlucuronsMure im Rahmen einer Aktivitatsf cbrbung bestimmt wer- 
den (Jefferson, 1987, Plant Molecular Biology Reporter 5, 
30 387-405) . Fur die Untersuchungen der Gewebespezif itat wird das 
pflanzliche Gewebe geschnitten, eingebettet, gef^rbt und analy- 
siert wie beschrieben {z.B. Baximlein H et al., 1991 Mol Gen Genet 
225: 121-128). 

35 Fluorimetrischer GUS-Test (nach Montgomeiry et al., 1993) 

Dieser Assay erlaubt eine quantitative Bestimmung der GUS-Aktivi- 
tat in dem untersuchten Gewebe. FCLr die quantitative Aktivitats- 
bestimmung wird als Substrat fiir die b-Glucuronidase MUG (4-Me- 
40 thyl-umbellif eryl-beta-D-glucuronid) verwendet, das in MU (Me- 
thyl -ximbellifer on) und Glucuronsaure gespalten wird. 

Dabei wird zunSchst ein Proteinextrakt des gewtoschten Gewebe 
hergestellt, dem dann das S\ibstrat der GUS zugesetzt wird. Das 
45 Substrat ist erst nach der Umsetzung durch GUS f luorimetrisch 
messbar, Zu verschiedenen Zeitp\mkten werden Proben entnommen, 
die anschlie&end im Fluorimeter gemessen werden. Dieser Test 
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wurde mit Leinembryonen verschiedener Altersstadien durchgef<ihrt 
(21, 24 Oder 30 Tage nach Beginn der Blute, daf = days after flo- 
wering) • Dazu wurde je ein Embryo in einem 2 ml-ReaktionsgefaS 
mit Hilfe einer Schwingmiihle (Retsch MM 2000) in flussigem Stick- 
5 stoff zu Pulver zerrieben. Nach Zugabe von 100 ml EGL-Puffer 
wurde ftLr 10 min bei 25C und 14000 x g zentrifugiert . Der Ober- 
stand wurde abgenommen und ein zweites Mai zentrifugiert. Wieder 
wurde der (Jberstand in ein neues Reaktionsgef aS uberfiihrt und bis 
2ur weiteren Verwendung auf Eis gehalten. Von diesem Proteinex- 

10 trakt wurden 25 ml mit 65 ml EGL-Puffer (ohne DTT) versetzt und 
far den GUS-Assay eingesetzt. Nun wurden 10 ml des Substrates MUG 
(10 mM 4-Methyl-umbelliferyl-l^-D-glucuronid) dazugegeben, gevor- 
text und sofort 30 ml als Nullwert entnommen und mit 470 ml 
Stopp-Puffer (0,2 M Na2C03 ) versetzt. Dieser Vorgang wurde fiir 

15 alle Proben in einem Abstand von 30 s wiederholt. Die entnoramenen 
Proben wurden bis zur Messung im Kiihlschrank gelagert. Weitere 
Messwerte wurden nach 1 h und nach 2 h entnommen. Flir die Messung 
im Fluorimeter wurde eine Eichreihe erstellt, die Konzentrationen 
von 0,1 raM bis 10 mM MU t4-Methyl-umbelliferon) enthielt. War en 

20 die Probenwerte auSerhalb dieser Konzentrationen, wurde weniger 
Proteinextrakt eingesetzt (10 ml, 1 ml, 1 ml aus 1:10 Verdiin- 
nung) , und es wurden kiirzere ZeitabstSLnde gemessen (0 h, 30 min, 
1 h) . Die Messung erfolgte bei einer Exitation von 365 nm und ei- 
ner Emission von 445 nm in einem Fluoroscan 11-GerS.t (Labsystem) . 

25 Altemativ kann die Substratspaltxing Unter alkalischen Bedingun- 
gen f luorometrisch verfolgt werden (Anregung bei 365 nm, Messung 
der Emission bei 455 nm; SpectroFluorimeter BMG Polarstar+) wie 
beschrieben in Bustos M.M. et al . , 1989 Plant Cell 1:839-853. 
Alle Proben wurden einer Proteinkonzentrationsbestimmung nach 

30 Bradford (1976) iinterzogen, um so eine Aussage tlber die Promote- 
raktivitat und -stSrke in verschiedenen Geweben und Pf lanzen er- 
lauben. 



EGL-Puffer 

35 0,1 M KPO4, pH 7,8 

ImM EDTA 

5 % Glycerin 

1 M DTT 



40' Als weitere Beispiele f\ir Reportergene 1 die aguivalent benutzt 
werden konnen, seien beispielhaft das grtin f luoreszierende Pro- 
tein (GFP) und dessen Derivate genannt (C.Reichel et al. (1996) 
Pr oc. Natl. Acad. Sci. USA 93, 5888-5893 und J. Sheen et al,, (1995) 
Plant Journal 8, 777-784) und verschiedene Luciferasen (A.Millar 

45 et al. (1992) Plant Mol. Biol. Reporter 10, 324-414), Die ent- 
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sprechenden Detektionsmethoden sind dem Fachmann bekannt xind z.B. 
genaxmter Literatur beschrieben. 

Beispiele fur Promoter-Reportergen-Konstrukte fiir oben genannte 
5 Promo toren sind im folgenden gegeben. Von diesen Promotoren kon- 
nen Fragmente mithilfe der Polymerasekettenreaktion isoliert und 
mit f lankiereaiden Sequenzen nach Wahl auf Basis von synthetischen 
Oligonukleotiden malSgeschneidert werden. 

10 Folgende Oligonukleotide konnen beispielsweise verwendet werden: 

LeB4 vorne: GAAAGCTTCTCGAGTTATGCATTTCTT 
LeB4 hint en: GGGTCTAGATCTGTGACTGTGATAG 
DC3a vorne: AGTGGATCCCCGAGCTAACCACAACT 
15 DC3a hinten: ATAAGCTTTTTCTTTGCAGA 

napinvorne : GAAAGCTTCTAATATGATAAACTCTG 
napinhinten: GGGTCTAGAAACACATACAAACATCAC 

Die Methoden sind dem Fachmann auf dem Gebiet bekannt und sind 
20 allgemein literaturbekannt . 

In einem ersten Schritt werden die Promotorf ragmente tiber PGR am- 
plifiziert, mit geeigneten Restrikticnsenzymen geschnitten und in 
die obigen Kassetten einkloniert. Beispielsweise wird das 

25 LeB4(700)-PCR~Fragment mit Xbal xjind Hindlll geschnitten und in 
den Vektor pGPTV in die Hindlll und Xbal-Schnittstellen 5' vor 
dem GUS Reportergen kloniert. Das PCR-amplif izierte DC3-Promoter- 
fragment kann mit BamHI und Hindlll geschnitten, z,B. in pBlues- 
cript (Stratagene)' subkloniert und dann in pGPTV in geeignete 

30 Schnittstellen vor das GUS-Reportergen kloniert werden. 

Beispielsweise kann ein mit obigen Primern PCR-amplif iziertes na- . 
pin-Promotorfragment mit einer GrSfie von lOSSbp nach Verdau mit 
Hindlll und Xbal in pGPTV vor das GUS Reportergen einkloniert 
35 werden. Ein Squivalentes Konstr-'okt konnte ein Napin-Promoter frag- 
ment von 110 Obp 5 '-kloniert vor ein GUS Reportergen mit Intron 
mit in 3 ^ Richtung nachf olgendem Nos-Terminator in einem 
pHL9000-Vektor (Hausmann & TSpfer, 1999) sein. 

40 Unter Verwendung von oben beschriebenen oder aquivalenten Kon- 
strukten nach Transformation in Lein der Sorte Flanders, lafit 
sich die GUS-Aktivitat in transgenen Leinembryonen verschiedener 
Altersstadien messen, die mit einem der folgenden Konstrukte 
trans foniiiert wurden: Napin-GUS, 35S-GUS, LeB4-GUS, USP-GUS. Die 

45 Werte sind Mittelwerte aus ein bis fiinf Messxingen mit verschiede- 
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nen Proteinmengen. Pro Konstrxxkt wurden je drei Embryonen quant i- 
tativ analysiert. 

In der quantitativen Analyse ergaben sich grofie Unterschiede zwi- 
5 schen den verschiedenen sainenspezifischen Promotoren. Der Napin 
Promotor aus Brassica napus erwies sich als urn zwei bis drei 
Zehnerpotenzen weniger aktiv als die beiden Promotoren aus Vlcla 
faba (LeB4 land USP) . Die GUS-Aktivitat nahm in der Reihenfolge 
Napin, LeB4 und USP zu. Die Positivkontrolle 35S bewegte sich in 
10 ihrer Aktivitat zwischen LeB4 imd USP, wohingegen die Negativkon- 
trolle, der nicht trans formierte Wildtyp (Sorte Flanders), so gut 
wie keine Aktivitat besalS. Die folgende Tabelle gibt die Mittel- 
werte der Aktivitaten in den einzelnen Altersstadien sowie gesamt 
fur jedes Konstrukt wieder. 

15 

Tabelle 3-4: tJbersicht iiber die mittleren GUS-Aktivitaten von 
Leinerabryonen, trans fontiiert mit verschiedenen GUS-Konstrukten. 
daf: Tage nach Beginn der BlUte. 

20 Mit * markiert wurden Werte, die nur einer Messung zugrxindelie- 
gen. 



25 



GUS- 


GUS-Aktivi- 


GUS-Aktivitat 


GUS-Aktivitat 


GUS-Aktivi^ 


% vs. 


Konstrukt 


tat [tmoV 


[nmol/h/mg Pro- 


[nmol/h/mg Pro- 


[lunol/h/mg Pro- 


358 




h/mg Protein] 


tein] 


tein] 


tein} 






Mittelwert 21 


Mittelwert 24 daf 


Mittelwert 30 daf 


Gesamtmittelwert 






daf 










Ohne 


0,06 


0,06 


*0,02 


0,05 


0,0007 


35S 


649,00 


913.00 


639,00 


734,00 


100,00 


Napin 


7,70 


• 5,70 


3,70 


5,70 


0,80 


LeB4 


1778,00 


253,00 


283,00 


771.00 


105,00 


USP 


2843,00 


3770,00 


2107,00 


2907,00 


396,00 



35 



Beispiel 13: Plasmide fttr die Fflanzentransformation 

Zur Pflanzentrans formation konnen binare Vektoren, wie pBinAR 
(Hofgen und Willmitzer, Plant Science 66 (1990) 221-230) oder 
pGPTV (Becker et al 1992, Plant Mol. Biol. 20:1195-1197) oder 
Derivate davon verwendet werden. Die Konstruktion der binaren 
Vektoren kann durch Ligation der cDNA in Sense- oder Antisense- 
Orientierung in T-DNA erfolgen. 5' der cDNA aktiviert ein 
Pflanzenpromotor die Transkription der cDNA. Eine Polyadenylie- 
rungssequenz befindet sich 3' von der cDNA. Die binaren Vektoren 
kSnnen unterschiedliche lyiarkergene tragen. Insbesondere kann das 
nptll-Markergen codierend ftlr Kanamycin-Resistenz- vermittelt 
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durch Neomycinphosphotransf erase gegen die herbizidresistente 
Foinn eines Acetolactat Synthasegens (Abklirziing: AHAS Oder ALS) 
ausgetauscht warden. Das ALS-Gen ist beschrieben in Ott et al., 
J. Mol. Biol. 1996, 263:359-360. Der v-ATPase-cl-Promotor kann in 
5 das Plasmid pBinl9 oder pGPW kloniert werden und durch Klonie- 
rung vor das ALS Codierregion fUr die Markergenexpression genutzt 
werden. Der genannte Promoter entspricht einem 1153 Basenpaar- 
fragment aus beta-Vulgaris (Plant Mol Biol, 1999, 39:463-475). 
Dabei k5nnen sowohl Sulphonylharastof f e als auch Imidazolinone 
10 wie Imazethapyr oder Sulphonylharnstof f e als Antimetaboliten zur 
Selektion verwendet werden. 

Die gewebespezifisclie Expression lasst sich unter Verwendung 
eines gewebespezif ischen Promotors erzielen. Beispielsweise kann 

15 die samenspezif ische Expression erreicht werden, indem der DC3- 
oder der LeB4- oder der USP-Promotor oder der Phaseolin-Proiriotor 
5' der cDNA einkloniert wird. Auch jedes andere samenspezif ische 
Promotorelement wie z.B. der Napin- oder Arcelin Proitiotor 
Goossens et al. 1999, Plant Phys. 120(41:1095-1103 und Gerhardt 

20 et al. 2000, Biochimica et Biophysica Acta 1490 (1-2) : 87-98) kann 
verwendet werden. Zur konstitutiven Expression in der ganzen 
Pflanzen l^sst sich der CaMV-35S- Promo tor oder ein v-ATPase CI 
Promoter verwenden. 

25 Insbesondere lassen sich Gene codierend fur Desaturasen \ind 
Elongasen durch Konstruktion itiehrerer Expressionskassetten 
hintereinander in einen binSren Vektor klonieren, urn den 
Stoffwechselweg in Pflanzen nachziibilden. 

30 Innerhalb einer Expressionskassette kann das zu exprimierende 
Protein unter Verwendung eines Signalpeptids, beispielsweise fur 
Plastiden, Mitochondrien oder das Endoplasmatische Retikulum, in 
ein zellulares Kompartiment dirigiert werden (Kermode, Grit. Rev. 
Plant Sci. 15, 4 (1996) 285-423). Das Signalpeptid wird 5' im 

35 Leseraster mit der cDNA einkloniert, um die subzellulSre Lokali- 
sierung des Fusionsprotein zu erreichen. 

Beispiele fiir Multiexpressionskassetten sind im folgenden 
gegeben . 

40 

I . ) Promotor-Terminator-Kassetten 

Expressionskassetten bestehen aus wenigstens zwei funktionellen 
Einheiten wie einem Promoter und einem Terminator. Zwischen 
45 Promoter und Terminator kdnnen weitere gewOnschte Gensequenzen 
wie Targetting-Sequenzen, Codierregionen von Genen oder Teilen 
davon etc. eingeftlgt werden. Zum Aufbau von Expressionskassetten 
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werden Proitiotoren und Terminator en (USP Promotor: Baeumlein 
et al., Mol Gen Genet, 1991, 225 (3):459-67); OCS Terminator: 
Gielen et al. EMBO J. 3 (1984) 835ff.) mithilfe der Polymerase- 
kettenreaktion isoliert und mit f lankierenden Sequenzen nach WahJL 
5 auf Basis von synthetischen Oligonukleotiden mafigeschneidert . 

Folgende Oligonukleotide konnen beispielsweise verwendet werden: 
USPl vome: CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA 
USP2 vorne : CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA 
10 USP3 vorne: CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA 
USPl hinten : AAAACTGCAGGCGGCCGCCCACCGCGGTGGGCTGGCTATGAAGAAATT 
USP2 hinten : CGCGGATCCGCTGGCTATGAAGAAATT 

USP3 hinten : TCCCCCGGGATCGATGCCGGCAGATCTGCTGGCTATGAAGAAATT 
OCSl vorne: AAAACTGCAGTCTAGAAGGCCTCCTGCTTTAATGAGATAT. 
15 0CS2 vorne: CGCGGATCCGATATCGGGCCCGCTAGCGTTAACCCTGCTT'TAATGAGATAT 
0CS3 vorne: TCCCCCGGGCCATGGCCTGCTTTAATGAGATAT 

OCSl hinten : CCCAAGCTTGGCGCGCCGAGCTCGAATTCGTCGACGGACAATCAGTAAATTGA 
OC S2 hinten : CCCAAGCTTGGCGCGCCGAGCTCGAATTCGTCGACGGACAATCAGTAAATTGA 
0CS3 hinten : CCCAAGCTTGGCGCGCCGAGCTCGTCGACGGACAATCAGTAAATTGA 

20 

Die Methoden sind dem Fachmann auf dem Gebiet bekannt \md sind 
allgemein literaturbekannt . 

In einem ersten Schritt werden ein Promotor und ein Terminator 
25 liber PGR amplifiziert. Dann wird der Terminator in ein Empfanger- 
plasmid kloniert und in einem zweiten Schritt der Promotor vor 
den Tertainator inseriert. Mithin erhSlt man eine Expressions- 
kassette auf einem TrSgerplasmid. Auf Basis des Plamides pUC19 
werden die Plasmide pUTl, pUT2 und pUT3 erstellt. 

30 

Die Konstrukte sind erf indungsgemaS in SEQ ID NO: 13, 14 und 15 
definiert. Sie enthalten auf Basis von pUC19 den USP-Promotor und 
den OCS Terminator. Auf Basis dieser Plasmide wird das Konstriokt 
pUTl2 erstellt, indem pUTl mittels Sall/Scal geschnitten wird und 

35 pUT2 mittels Xhol/Scal geschnitten wird. Die die Expressions- 
kassetten enthaltenden Fragmente werden ligiert imd in E, coli 
XLI blue MRF trans formiert. Es wird nach Vereinzelung ampicillin- 
resistenter Koionien DNA prapariert \ind per Restriktionsanalyse 
solche Klone identifiziert, die zwei Expressionskassetten ent- 

40 halten. Die Xhol/Sall Ligation kompatibler' Enden hat dabei die 
beiden Schnittstellen Xhol und Sail zwischen den Expressions- 
kassetten eliminiert. Es resultiert das Plasmid pUT12, das in 
SEQ ID NO: 16 definiert ist. Anschliefiend wird pUTl2 wiederum 
mittels Sal/Scal geschnitten und pUT3 mittels XhoI/Scal ge- 

'45 schnitten. Die die Expressionskassetten enthaltenden Fragmente 
werden ligiert und in'E. coli XLI blue MRF transf ormiert . Es wird 
nach Vereinzelung ampicillinresistenter Koionien DNA prfipariert 
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und per Restriktionsanalyse solche Klone identifiziert, die drei 
Expressionskassetten enthalten. Auf diese Weise wird ein Set von 
Multiexpressionskassetten geschaffen, dass fiir die Insertion ge- 
wiinschter DKA genutzt werden kann tind in Tabelle 3 beschrieben 
5 wird mid zudem nocli weitere Expressionskassetten aufnehmen kann. 

Diese enthalten folgende Elemente: 

Tabelle 3 



20 



pUCl9- 
Derivat 


Schnittstellen vor dem 
USP Promotor 


Multiple 
Klonienings-Schnittstellen 


Schnittstellen hinter dem 
OCS-Terminator 


pUTl 


EcoRI/AscI/ Sacl/Xhol 


BstXI/NotI/ Pstl/Xbal/StuI 


Sall/EcoRI/SacI/AscI/ 
Ilindin 


pUT2 


EcoRI/AscI/ Sacl/Xhol 


BamHI/EcoRV/ Apal/Nhd/Hpal 


Sail/EcoRI/SacI/AscI/ 
Hindin 


pUT3 


EcoRI/AscI/SacI/XhoI 


Bgin/Nael/ Clal/Smal/Ncol 


Sall/Sacl/Ascl/Hindm 


pUT12 

Doppel-expres- 
sionskassette 


EcoRl/AscI/ Sacl/Xhol 


BstXI/NotU Psfl/Xbal/StuI 
Und 

BamHI/EcoRV/ Apal/Nhel/ Hpal 


Sall/EcoRI/SacI/AscI/ 
Hicdm 


pUT123 

Tripel-expres- 

sionskassette 


EcoRI/AscI/ Sacl/Xhol 


1 33tXI/NotI/ Pstl/Xbal/StuI 
imd 

23amffl/EcoRV/ Apal/Nhd/ 

Hpal 

und 

3.Bgm/l^aeI/ Clal/Smal/NcoI 


SaJiySacI/AscI/Hindin 



25 



Weiterhin lassen sich wie beschrieben und wie in Tabelle 4 nSher 
spezifiziert weitere Multiexpressionskassetten mithilfe des 

30 i) USP-Promotors oder mithilfe des 

ii) ca. 700 Basenpaare 3 ' -Fragmentes des LeB4-Proniotors oder 

mithilfe des 

iii) DC3-Promotors erzeugen und fur samenspezif ische Genexpression 
einsetzen. 

35 

Der DC3-Proinotor ist beschrieben bei Thomas, Plant Cell 1996, 
263:359-368 und besteht lediglich aus der Region -117 bis +27 
weshalb er mithin einer der kleinsten bekannten samenspezif ischen 
Promotoren darstellt. 

40 

Von diesen Promotoren kdnnen Fragmente mithilfe der Polymerase- 
kettenreaktion isoliert und mit f lankierenden Sequenzen nach Wahl 
auf Basis von synthetischen Oligonukleotiden mafigeschneidert wer- 
den. 

45 

Folgende Oligonukleotide konnen beispielsweise verwendet werden: 
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LeB4 vorne: GAAAGCTTCTCGAGTTATGCATTTCTT 
LeB4 hinten: GGGTCTAGATCTGTGACTGTGATAG 
DC3a vorne: CCGGAATTCGGCGCGCCGAGCTCCTCGAG 
DC3a hinten: CGCGGATCCTAGCTTTTTCTTGGCAGATG 

5 

Die Methoden sind dem Fachmann auf dera Gebiet bekannt und sind 
allgemein literaturbekannt . 

In einem ersten Schritt werden die Promotorfragmente tiber PGR am- 
10 plifiziert, mit geeigneten Restriktionsenzymen geschnitten \ind in 
die obigen Kassetten einkloniert. Beispielsweise wird das 
LeB4{700)-PCR-Fragment mit Xhol und Bglll geschnitten und in die 
Xhol und Bglll-Schnittstellen des Plasmids pUT3 eingesetzt, uin 
pLT3 zu erhalten. 

15 

Vorteilhafte Express ionskasset ten enthalten auf Basis von pUCl9 
(Vieira und Messing (1982); Gene 19, 259), die SEQ ID NO: 32, den 
LeB4-Promotor und die Sequenzen SEQ ID NO: 33, SEQ ID NO: 34 oder 
SEQ ID NO: 35. Auf Basis dieser Plasmide wird das Konstrukt pLTl2 

20 erstellt, indent pUTl mittels Sall/Scal geschnitten wird und pUT2 
mittels Xhol/Scal geschnitten wird. Die die Express ionskasset ten 
enthaltenden Fragment e werden ligiert und in E, coli XLI blue MRF 
transformiert. Es wird nach Vereinzelung Ampicillin-resistenter 
Kolonien DMA prapariert und per Restriktionsanalyse solche Klone 

25 identifiziert, die zwei Expressionskassetten enthalten. Die Xhol/ 
Sail Ligation kompatibler Enden hat dabei die beiden Schnittstel- 
len Xhol urid Sail zwischen den Expressionskassetten eliiainiert, 
Es resiiltiert das Plasmid pUTl2, das in SEQ ID NO: 16 definiert 
ist. AnschlieSend wird pUT12 wiederum mittels Sal/ Seal geschnit- 

30 ten oind pUT3 mittels Xhol/ Seal geschnitten. Die die Expressions- 
kassetten enthaltenden Fragment© werden ligiert und in E. coli 
XLI blue MRF transformiert. Es wird nach Vereinzelung Ampicillin- 
resistenter Kolonien DNA prapariert und per Restriktionsanalyse 
solche Klone identif iziert, die drei Expressionskassetten enthal- 

35 ten. Auf diese Weise wird eine Auswahl von Multiexpressionskas- 
setten geschaffen, die fur die Insertion gewvinschter DNA genutzt 
werden kann und in Tabelle 3 beschrieben wird und zudem noch wei- 
tere Expressionskassetten aufnehmen kann. 

40 Die Expressionskassetten konnen mehrfach den selben Promoter ent- 
halten Oder aber Ober drei verschiedene Promotoren auf gebaut wer- 
den. 



45 
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Tabelle 4: Multiple Expressionskassetten. 



5 



10 



15 



20 



Plasmidname des 
pUCl^-Derivates 


Schnittstellen vor dem 
jeweiligen Promotor 


Multiple 
Klonierungs-Scbnittstellen 


Schnittstellen hinter 
dem OCS-Tenninator 


pUTl 

(pUC19mit 
USP-OCSl) 


EcoRl/AscI/SacI/XhoI 


(1) BstXI/Notl/PstI/ Xbal/StuI 


Sall/EcoRI/SacI/AscI/ 

Hindin 


pDCT 

(pUC19mit 

DC3-0CS) 


EcoRI/AscI/SacI/XhoI 


(2) BamHI/EcoRV/ Apal/Nhel/ 

Hpal 


Sall/EcoRI/SacI/AscI/ 

Hmdin 


pLeBT 

(pUC19~mit 

LeB4(700}-OCS) 


EcoRI/AscI/SacI/XhoI 


(3) Bgin/Nael/ Clal/Smal/Ncol 


Sall/Sacl/Ascl/Hindm 


pUD12 

(pUC 19 mit mit 
USP-OCSl und mit 
DC3-OCS) 


EcoRI/AscI/SacI/XhoI 


(1) BstXl/Notl/ FstlOaal/StuI 
und 

(2) Bamm/EcoRV/ ApalMieV 
Hpal 


Sall^coRI/SQcI/Ascl/ 
({indin 


pUDLi23 
Triple expression 

cassette 

(pUC19initUSP/ 

DC3und 

LeB4-700) 


£coRI/AscI/SacI/XhoI 


(1) BstXI/NotI/ PstiyXbal/StuI 
und 

(2) .Ban2HI/ (EcoRV*)/ApaI/ 
Nhel/Hpalund 

(3) Bgin/Nael/ Clal/Smal/Ncol 


Sall/Sacl/Ascl/Hindni 



* EcoRV Schnittstelle schneidet im 700 Basenpaarfragment des LeB4 
Promotors {LeB4-700) 

25 

Analog lassen sich weitere Promotoren fur Multigenkonstrukte 
erzeugen insbesondere unter Verwendung des 

a) 2,4 kB Fragmentes des LeB4 -Promotors (Batunlein et al., 1991: 
^0 Mol. Gen. Genet. 225,121-128) oder mithilfe des 

b) Phaseolin-Promotors (Bustos et al. (1989) Plant Cell 
1,839-853) Oder mithilfe des 

^5 c) konstitutiven v-ATPase cl-Promotors . 

Es kann insbesondere wimschenswert sein, weitere besonders geei- 
gnete Promotoren zuia Aufbau samenspezif ischer Multiexpressions- 
kassetten wie z.B. eines der Fragmente des Napin- Promoters (Stal~ 
^0 berg et al., 1993: Plant Mol. Biol. 23, 671-683) oder den Arcelin-5 
Promotor (A.Goossens et al.', 1999: plant Physiol. 120,1095-1104) 
zu verwenden. 



45 
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ii) Erstellung von Expressionskonstrukten in pUCl9- oder pGPTV 
Derivaten, die Promotor und Terminator erhalten und in 
Kombination mit gewiinschten Gensequenzen zur PUFA Gen- 
expression in pflanzlichen Expressionskassetten enthalten. 

5 

Multiexpressionskassetten konnen mittels AscI direkt von 
pUC19-Derivaten aus Tabelle 3 in den Vektor pGPTV+AscI (siehe 
iii.)) tiber die AscI Schnittstelle inseriert werden imd stehen 
zur Inserierung von Zielgenen zur Verfiigung. Die entsprechenden 

10 Genkonstrukte (pBUTl ist in SEQUENZ ID NO: 20, pBUT2 ist in 
SEQUENZ ID NO: 21, pBUT 3 ist in SEQUENZ ID NO: 22, pBUTl2 
ist in SEQUENZ ID NO: 22 und pBUT123 ist in SEQUENZ ID NO: 24 
dargestellt) stehen erf indunsgemaS als Kit zur Verf^gung, 
Alternativ k5nnen Gensequenzen in die pUC19 basierten 

15 Expressionskassetten inseriert werden und als AscI Fragment 
in pGPTV+AscI eingesetzt werden. 

In pUT12 wird zunachst iiber BstXI und Xbal die D-6-Elongase 
Pp_PSEl in die erste Kassette inseriert. Dann wird die 

20 D-6-Desaturase aus Moos (Pp_des6) tiber BamHI/Nael in die 

zweite Kassette inseriert. Es entsteht das Konstrukt pUT-ED.Das 
AscI Fragment aus dem Plasmid pUT-ED wird in den mit AscI ge- 
schnittenen Vektor pGPTV+AscI inseriert und die Orientierung des 
inserierten Fragitientes mittels Restriktion oder Sequenzierung 

25 ermittelt. Es entsteht das Plasmid pB-DHGLA, dessen vollstSndige 
Sequenz in SEQUENZ ID NO. 25 dargestellt ist. Die Codierregion 
der Physcomitrella delta 6 Elongase ist in SEQUENZ ID NO. 26 
dargestellt, die der delta 6 Desaturase aus Physcomitrella in 
SEQUENZ ID NO: 27. 

30 

In PUT123 wird zunachst iiber BstXI und Xbal die A-6-Elongase 
Pp_PSEl in die erste Kassette inseriert. Dann wird die 
A-6-Desaturase aus Moos (Pp_des6) iiber BamHI/Nael in die 
zweite Kassette inseriert und schlieSlich die A-5 -Desaturase 
35 aus Phaeodactylum (Pt„des5) tiber Bglll in die dritte Kassette 
inseriert. Das Dreif achkonstrukt erhalt den Namen pARAl. Unter 
Berucksichtigung sequenzspezif ischer Restriktionsschnittstellen 
konnen weitere Expressionskassetten gemaS Tabelle 5 mit der 
Bezeichnung pARA2, pARA3 und pARA4 erstellt werden. 

40 

Das AscI Fragment aus dem Plasmid pARAl wird in den mit AscI 
geschnittenen Vektor pGPTV+AscI inseriert und die Orientierung 
des inserierten Fragmentes mittels Restriktion oder Sequenzierung 
ermittelt. Die vollstandige Sequenz des resultierenden Plasmides 
45 pBARAl ist in SEQUENZ ID NO. 28 dargestellt. Die Codierregion 
der Physcomitrella delta 6 Elongase. ist in SEQUENZ ID NO. 29 
dargestellt^ die der delta 6 Desaturase aus Physcomitrella 
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in SEQUENZ ID NO: 30 und die der delta-5 Desaturase aus 
Phaeodactylum tricomutum in SEQUENZ ID NO: 31. 



Tabelle 5: Kombinationen von Desaturasen und Elongasen 



5 





Gen 
Plasraid 


A-6-Desatura5e 


A-5-Desaturase 


A-6-Elongase 


I 


PUT-ED 


Pp_des6 




PpJPSEl 


2 


pARAl 


Ptjdes6 


Pt_des5 


PpJPSEl 


3 


pARA2 


PL.des6 


Cc_des5 


PpJSEl 


4 


pARA3 


Pt_des6 


Ce_des5 


PpJPSEl 


5 


pARA4 


Ce_des6 


Ce_des5 


Ce^PSEl 


6 


PBDHGLA 


Pt_des6 




Pp PSEl 


7 


PBARAI 


Ptjdcs6 


Pt.dcs5 


tpJPSEl 



Plasmide 1 bis 5 sind pUC Derivate, Plasmide 6 bis 7 sind binare 
Pf lanzentransformationsvektoren 



20 



Pp = Physcomitrella patens, Pt = Phaeodactylum tricornutijm 
Pp_PSEl entspricht der Sequenz aus SEQ ID NO: 9. 
PSE = PUFA spezifische A-6-Elongase 
Ce_des5 = A-5 -Desaturase aus Caenorhabditis elegans (Genbank Acc. 
Nr. AF078796) 

Ce^ciesg = A-6 -Desaturase aus Caenorhabditis elegans elegans 
(Genbank Acc. Nr. AF031477, Basen 11-1342) 

Ce_PSEl = A-6-Elongase aus Caenorhabditis elegans (Genbank Acc. 
Nr. AF244356., Basen 1-867) 

Auch weitere Desaturasen oder Elongasegenseguenzen kdnnen in 
Expressionskassetten beschriebener Art inseriert werden wie 
2.B. Genbank Acc. Nr. AF231981, NM_013402, AF206662, AF268031, 
AF226273, AF110510 oder AF110509. 



30 



iii) Transfer von Expressionskassetten in Vektoren zur 

Transformation von Agrobakterium tiamefaciens und zur 
Transformation von Pflanzen 

Chimare Genkonstrukte auf Basis der in pUC19 beschriebenen konnen 
' mittels AscI in den bin^ren Vektor pGPTV inseriert. Die multiple 
^ Klonierungssequenz wird zu diesem Zweck um eine AscI Schnitt- 

stelle erweitert. Zu diesem Zweck wird der Polylinker als zwei 
: doppelstrangige Oligonukleotide neu synthetisiert , wobei eine zu- 
satzliche AscI DNA Sequenz eingefUgt wird. Das Oligonukleotid 
wird mittels EcoRI \md Hindlll in den Vektor pGPTV inseriert. Es 
entsteht das Plasmid pGPTV+AscI. Die notwendigen Kloniertechniken 
sind dem Fachmann bekannt \ind kfinnen edLnfach wie in Beispiel 1 
beschrieben nachgelesen werden. 



wo 02/U57464 



PCT/EPU2/00461 



99 

- Beispiel 14: In viw-Mutagenese 

Die in vivo-Mutagenese von Mikroorganismen kann mittels Passage 
der Plasmid- (oder einer andersn Vektor-) DNA durch E. coli 
5 Oder andere Mikroorganismen (z.B, Bacillus spp. oder Hefen, 
wie Saccharoittyces cerevisiae) , bei denen die FShigkeiten, die 
Unversehrtlieit ihrer genetischen Information aufrechtzuerhalten, 
gestSrt ist^ erfolgen. Ubliche Mutator-St&nme haben Mutationen in 
den Genen far das DNA-Reparatur system (z.B. inutHLS, mutD, mutT 

10 usw. ; als Literaturstelle siehe Rupp, W.D. (1996) DNA repair 
mechanisms, in: Escherichia coli and Salmonella, S. 2277-2294, 
ASM: Washington). Diese St&nme sind dem Fachitiann bekannt. Die 
Verwendung dieser Stamme ist beispielsweise in Greener, A., und 
Callahan, M. (1994) Strategies 7:32-34, eriautert. Der Transfer 

15 mutierter DNA-Molekule in Pflanzen erfolgt vorzugsweise nach 

Selektion und Test der Milcrooganismen. Transgene Pflanzen werden 
nach verschiedenen Beispielen im Beispielteil dieses Dokumentes 
erzeugt . 

20 Beispiel 15: Untersuchung der Expression eines rekombinanten 
Genproduktes in einecn trans formier ten Organismus 

Die Aktivitat eines rekombinanten Genproduktes im transf ormierten 
Wirtsorganismus kahn auf der Transkriptions- und/oder der 
25 Translationsebene gemessen werden. 

Ein geeignetes Verfahren zur Bestiinmting der Menge an 
Transkription des Gens (ein Hinweis auf die Menge an RlsIA, 
die ftir die Translation des Genproduktes zur Verfugung steht) 

30 ist die Durchfiihrung eines Northern-Blots wie unten ausgeftihrt 
(als Bezugsstelle siehe Ausubel et al. (1988) Current Protocols 
in Molecular Biology, Wiley: New York, oder den oben erwahnten 
Beispielteil), wobei ein Primer, der so gestaltet ist, dass 
er an das Gen von Interesse bindet, mit einer nachwaisbaren 

35 Markierung (gewahnlich radioaktiv oder chemilumineszent) markiert 
wird, so dass, wenn die Gesamt-RNA einer Kultur des Organismus 
extrahiert, auf einem Gel aufgetrennt, auf eine stabile Matrix 
transf eriert und mit. dieser Sonde inkubiert wird, die Bindung und 
das AusmaS der Bindung der Sonde das Vorliegen und auch die Menge 

40 der mRNA fUr dieses Gen anzeigt. Diese Information zeigt den 
Grad der Transkription des transf ormierten Gens an. Zellulare 
Gesamt-RNA kann aus Zellen, Geweben oder Organen mit mehreren 
Verfahren, die alle im Fachgebiet bekcinnt sind, wie zum Beispiel 
das von Bormann, E.R., et al. (1992) Mol, Microbiol. 6:317-326 

45 beschriebene , prapariert werden. 
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Northern-Hybridisierxing 

Fiir die RNA-Hybridisieznng wurden 20 |xg Gesamt-RNA Oder 1 [ig 
poly{A)+-RNA itiittels Gelelektrophorese in Agarosegelen mit 
5 einer Starke von 1,25 % "unter Verwendung von Formal dehyd, wie 
beschrieben in Amasino (1986, Anal. Biochem. 152, 304) auf- 
getrennt; mittels Kapillaranziehung ijnter Verwendxxng von 10 x 
SSC auf positiv geladene Nylonmembranen (Hybond N+, Amersham, 
Braiinschweig) ubertragen, mittels UV-Licht immobilisiert und 

10 3 Stiinden bei 68°C unter Verwendung von Hybridisierungspuf f er 

(10 % Dextransulfat Gew./Vol., 1 M NaCl, 1 % SDS, 100 mg Herings- 
sperma-DNA) vorhybridisiert. Die Markierung der DNA-Sonde mit 
dem Highprime DNA labeling-Kit .(Roche, Mannheim, Deutschland) 
erfolgte w^hrend der Vorhybridisierung unter Verwendung von 

15 alpha'^2p-ciCTP (Amersham, Braunschweig, Deutschland) . Die Hybridi- 
sierung wurde nach Zugabe der markierten DNA-Sonde im gleichen 
Puffer bei 68°C Uber Nacht durchgefiihrt . Die Waschschritte wurden 
zweimal fiir 15 lain unter Verwendung von 2 X SSC und zweimal fiir 
30 min unter Verwendung von 1 X SSC, 1 % SDS, bei 68'*C durch- 

20 gefOhrt, Die Exposition der verschlossenen Filter wurde bei -70*'C 
ftlr einen Zeitraum von 1 bis 14 T durchgefiihrt. 

Zur Untersuchung des Vorliegens oder der relativen Menge an von 
dieser mRNA translatiertem Protein kSnnen Standardtechniken, wie 

25 ein Western-Blot, eingesetzt werden (siehe beispielsweise Ausubel 
et al. (1988) Current Protocols in Molecular Biology, Wiley: 
New York) . Bei diesem Verfahren werden die zellulSren Gesamt- 
Proteine extrahiert, mittels Gelelektrophorese aufgetrennt, 
auf eine Matrix, wie Nitrozellulose, iibertragen und mit einer 

30 Sonde, wie einem Antikorper, der spezifisch an das gewtinschte 
Protein bindet, inkubiert. Diese Sonde ist gewahnlich mit einer 
chemilumineszenten oder kolorimetrischen Markierung versehen, 
die sich leicht nachweisen lasst . Das Vorliegen und die Menge 
der beobachteten Markierung zeigt das Vorliegen und die Menge des 

3S gewiinschten, in der Zelle vorliegenden muti'erten Proteins an. 

Beispiel 16: Analyse der Auswirkung der rekombinanten Proteine 
auf die Produktion des gewiinschten Produktes 

40 Die Auswirkung der genetischen Modifikatiori in Pflanzen, Pilzen, 
Algen, Ciliaten oder auf die Produktion einer gewiinschten- Ver- 
bindung (wie einer Fettsaure) kann bestimmt* werden, indem die 
modifizierten Mikroorganismen oder die modifizierte Pflanze 
unter geeigneten Bedingungen (wie den vorstehend beschriebenen) 

45 gezilchtet werden und das Medium und/oder die zellularen Kompo- 
nenten auf die erhfihtfe Produktion des gewiinschten Prodiiktes (d.h. 
von Lipiden oder einer Fetts&ure) untersucht wird. Diese Analyse- 
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techniken sind dem Fachmann bekannt und umfassen Spektroskopie, 
Dtiimschichtchromatographie, Farbeverfahren verschiedener Art, 
enzymatische und mikrobiologische Verfahren sowie analytische 
Chromatographie, wie Hochleistungs-Fltissigkeitschromatographie 
5 (siehe beispielsweise Ullman, Encyclopedia of Industrial 

Chemistry, Bd. A2, S. 89-90 und S. 443-613, VCH: Weinheim (1985); 
Fallon, A., et al., (1987) ''Applications of HPLC in Biochemistry" 
in: Laboratory Techniques in Biochemistry and Molecular Biology, 
Bd. 17? Rehm et al. (1993) Biotechnology, Bd. 3, Kapitel III: 

10 "Product recovery and purification", S, 469-714, VCH: Weinheim; 
Belter, P. A., et al. (1988) Bioseparations : downstream processing 
for Biotechnology, John Wiley and Sons; Kennedy, J.F., und 
Cabral, J.M.S. (1992) Recovery processes for biological Materi- 
als, John Wiley and Sons; Shaeiwitz, J. A., und Henry, J.D. (1988) 

15 Biochemical Separations, in: Ullmann's Encyclopedia of Industrial 
Chemistry, Bd. B3; Kapitel 11, S. 1-27, VCH: Weinheim; und 
Dechow, F.J- (1989) Separation and purification techniques in 
biotechnology, Noyes Publications) . 

20 Neben den oben erwShnten Verfahren werden Pf lanzenlipide aus 
Pflanzenmaterial wie von Cahoon et al. (1999) Proc* Natl. Acad. 
Sci. USA 96 (22) :12935-12940, und Browse et al. (1986) Analytic 
Biochemistry 152 s 141-145, beschrieben extrahiert. Die qualitative 
und quantitative Lipid- oder FettsSureanalyse ist beschrieben 

25 bei Christie, William W. , Advances in Lipid Methodology, Ayr/ 
Scotland: Oily Press (Oily Press Lipid Librairy; 2} ; Christie, 
William W. , Gas Chromatography and Lipids. A Practical Guide 
- Ayr/ Scotland: Oily Press, 1989, Repr. 1992, IX, 307 S. (Oily 
Press Lipid Libra2ry; 1) ; "Progress in Lipid Research, Oxford: 

30 Pergamon Press, 1 (1952) - 16 (1977) u.d.T. : Progress in the 
Chemistry of Fats and Other Lipids CODEN. 

Zusatzlich zur Messimg des Endproduktes der Fermentation ist 

es auch moglich, andere Komponenten der Stof fwechselwege zu ana- 

35 lysieren, die zur Produktion der gewunschten Verbindung verwendet 
werden, wie Zwischen- \md Nebenprodukte, xim die Gesamtef fizienz 
der Produktion der Verbindung zu bestimmen. Die Analyseverfahren 
umfassen Messimgen der NShrstoffmengen im Medium (z.B. Zucker, 
Kohlenwasserstoff e, Stickstof f guellen, Phosphat \md andere 

40 lonen) , Messungen der Biomassezusammensetzxmg \md des Wachstums, 
Analyse der Produktion ublicher Metabolite von Biosynthesewegen 
und Messungen von Gasen, die v/ahrend der Fermentation erzeugt 
werden. Standardverfahren fOr diese Messungen sind in Applied 
Microbial Physiology; A Practical Approach, P.M. Rhodes und P.F. 

45 Stanbury, Hrsgb., IRL Press, S. 103-129; 131-163 und 165-192 
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(ISBN: 0199635773) xmd darin angegebenen Literaturstellen 
beschrieben . 

Ein Beispiel ist die Analyse von FettsSuren (Abkarzungen: FAME, 
5 Fettsauremethyl ester; GC-MS, Gas-Flussigkeitschromatographie- 
Massenspektrometrie; TAG, Triacylglycerin; TLC, Diirmschicht- 
chromatographie) . 

Der unzweideutige Nachweis fur das Vorliegen von FettsSure- 
10 produkten kann laittels Analyse rekombinanter Organismen nach 
Standard-Analyseverfahren erhalten werden: GC, GC-MS oder TLC, 
wie verschiedentlich beschrieben von Christie und den Literatur- 
stellen darin (1997; in: Advances on Lipid Methodologyy Vierte 
Aufl.: Christie, Oily Press, Dundee, 119-169; 1998, Gaschromato- 
15 graphie-Massenspektrometrie-Verfahren, Lipide 33:343-353). 

Das zu analysierende Material kann durch Ultras challbehandlung, 
Mahlen in der Glasmiihle, flussigen Stickstoff und Mahlen oder 
iiber andere anwendbare Verfahren aufgebrochen werden. Das 

20 Material muss nach dem Aufbrechen zentrifugiert werden. Das 
Sediment wird in Aqua dest. resuspendiert , 10 min bei lOO^C 
erhitzt, auf Eis abgekiihlt und erneut zentrifugiert, gefolgt 
von Extrakticn in 0,5 M Schwefelsaure in Methanol mit 2 % 
Dimethoxypropan fur 1 Std, bei 90'*C, was zu hydrolysierten 01- 

25 und Lipidverbindungen ftort, die trauismethylierte Lipide ergeben. 
Diese Fettsauremethylester werden in Petrolether extrahiert und 
schlieiSlich einer GC-Analyse unter Verwendung einer KapillarsSule 
(Chrompack, WCOT Fused Silica, CP-Wax-52 CB, 25 mikrom, 0,32 mm) 
bei einem Tempera tur gradient en zwischen 170®C und 240^C fiir 20 min 

30 und 5 min bei 240''C unterworfen. Die Identitat der erhaltenen 
Fettsauremethylester muss unter Verwendung von Standards, die 
aus kommerziellen Quellen erhaltlich sind (d.h. Sigma), definiert 
werden . 

35 Bei Fettsauren, ftir die keine Standards verf^igbar sind, muss die 
Identitat uber berivatisierung und anschliefiende GC-MS-Analyse 
gezeigt werden. Beispielsweise muss die Lokalisierung von Fett- 
sauren mit Dreif achbindung tiber GC-MS nach Derivatlsierung mit 
4, 4-Dimethoxyoxazolin-Derivaten (Christie, 1998, siehe oben) 

40 gezeigt werden. 
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Expressionskonstrukte in heterologen mikrobiellen Systemen 

Stamme, Wachstumsbedingungen und Plasmide 

5 Der Escherichia coli-Staram XLl Blue MRF' kan (Stratagene) wurde 
zur Siibklonierung der neuen Desaturase pPDesatiirasel aus Physco- 
mitrella patens verwendet. Ftlr die funktionelle Expression dieses 
Gens verwendeten wir den Saccharomyces cerevisiae-Stamm INVSc 1 
(Invitrogen Co.). E. coli wurde in Luria-Bertini-Briihe (LB, 

10 Duchefa, Haarlem, Niederlande) bei 37^C kultiviert. Wenn notig, 
wurde Ampicillin (100 mg/Liter) zugegeben, und 1,5 % Agar (Gew./ 
Vol.) wurde ftlr feste LB-Medien hinzugefugt. S. cerevisiae wurde 
bei 30«>C entweder in YPG-Medium Oder in komplettem Miniiaalmediura 
ohne Uracil (CMdum; siehe in: Ausubel, F.M. , Brent, K., Kingston, 

15 R.E,, Moore, D.D., Seidman, J.G., Smith, J.A, , Strtihl; K., 
Albright, L.B., Coen, und Varki, A. (1995) Current 

Protocols in Molecular Biology, John Wiley & Sons, New York) 
mit entweder 2 % (Gew. /Vol.) Raffinose oder Glucose kiiltiviert. 
Fur feste Medien wurden 2 % (Gew, /Vol. ) Bacto~-Agar (Difco) 

20 hinzugef (igt . Die zur Klonierung und Expression verwendeten 
Plasmide sind pUCl8 (Pharmacia) und pYES2 (Invitrogen Co.). 

Beispiel 17: Klonierung und Expression PUFA-spezif ischer 
Desaturasen aus Phaeodactylum tricornutvim 

25 

Piir die Expression in Hefe wurden die Phaeodactylum tricomutum 
-cDNA-Klone aus Seq ID NO: 1, 3, 5 oder 11 bzw. die Sequenzen 
aus SEQ ID NO: 7 oder 9 bzw andere gewiinschte Sequenzen zuerst so 
modifiziert, dass lediglich die Codierregion mittels Polymerase 

30 Kettenreaktion unter Ziihilfenahme zweier Oligonukleotide ampli- 
fiziert werden. Dabei wurde darauf geachtet, dass eine Konaenau- 
sequenz vor dem Startcodon zur eff izienten Translation ein- 
gehalten wurde. Entweder wurde hierzu die Basenfolge ATA oder 
AAA gewShlt und voir das ATG in die Sequenz eingefUgt (Kozak, M. 

35 (1986) Point mutations define a sequence flanking the AUG 
initiator codon that modulates tramslation by eukaryotic 
ribosomes. Cell 44, 283-292) . Vor diesem Konsensus triple tt 
wurde zusStzlich eine Restriktionsschnittstelle eingeftihrt, 
die kompatibel sein muss zur Schnitts telle des Zielvektors, 

40 in den das Fragment kloniert werden soil und mit dessen Hilfe 
die Genexpression in Mikroorganismen oder Pflanzen erfolgen 
soli. 
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Die PCR-Reaktion wurde mit Plasinid-DNA als Matrize in einera 
Thermocycler (Biometra) mit der Pfu-DNA- (St ratagene) Polymerase 
und dem folgenden Temperaturprogramm durchgefiihrt: 3 min bei 96^C, 
gefolgt von 30 Zyklen mit 30 s bei B6°C, 30 s bei 55''C und 2 min 
5 bei 72**C, 1 Zyklus mit 10 min bei 72°C und Stop bei 4°C. Die 
Anlagerungs tempera tur wurde je nach gewahlten Oligonukleotiden 
variiert. Pro Kilobasenpaare DNA ist von einer Synthesezeit von 
etwa einer Minute auszugehen. Wei t ere Parameter, die Einfluss auf 
die PGR haben wie z.B. Mg-Ionen, Salz, DNA Polymerase etc., sind 
10 dem Fachmann auf dem Gebiet gelSuf ig und k5nnen nach Bedarf 
variiert werden. 

Die korrekte GroSe des amplif izierten DNA-Fragments wurde mittels 
Agarose-TBE-Gelelektrophorese bestatigt. Die amplif izierte DNA 

15 wurde aus dem Gel mit dem QIAquick-Gelextraktionskit (QIAGEN) 
extrahiert und in die Smal-Restriktionsstelle des dephosphory- 
lierten Vektors pUCl8 unter Verwendung des Sure Clone Ligations 
Kit (Pharmacia) ligiert, wobei die pUC-Derivate erhalten wurden. 
Nach der Transformation von E. coli XLl Blue MRF' kan wurde 

20 eine DNA-Miixipraparation (Riggs, M.G., & McLachlan, A. (1986) A 
simplified screening procedure for large numbers of plasmid mini- 
preparation, BioTechniques 4, 310-313) an ampicillinresistenten 
Trans formanden durchgefiihrt, und positive Klone mittels BamHI- 
Restriktionsanalyse identifiziert , Die Sequenz des klonierten 

25 PCR-Produktes wurde mittels Reseguenzierung unter Verwendung des 
ABI PRISM Big Dye Terminator Cycle Sequencing Ready. Reaction Kit 
(Perkin-Elmer, Welters tadt) bestatigt. 

A5 Acyl Lipid desaturase, Pt_des5 
30 Primer 1 GAG CTC ACA TAA TGG CTC CGG ATG CGG ATA AGC 
Primer 2 CTC GAG TTA CGC CCG TCC GGT CAA GGG 

Das PCR-Fragment (1428bp) wurde mithilfe des Sure Clone Kit 
(Pharmacia) in pUC 18 kloniert, das inserierte Fragment Sacl/Xhol 
35 verdaut und das Fragment mithilfe entsprechender Restriktions- 
schnittstellen in pYES2 oder pYES6 inseriert. 

A6 Acyl Lipid desaturase, Pt.des6 

Primer 3 GGA TCC ACA TAA TGG GCA AAG GAG GGG ACG CTC GGG 
40 Primer 4 CTC GAG TTA CAT GGC GGG TCC ATC GGG 

Das PCR- Fragment (1451 bp) wurde mithilfe des Sure Clone 
Kit (Pharmacia) in pUC 18 kloniert, das inserierte Fragment 
BamHI/XhoI verdaut und das Fragment mithilfe entsprechender 
45 Restriktionsschnittstellen in pYES2 oder pYES6 inseriert. 
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A12 Acyl Lipid desaturase, Pt_desl2 

Primer 5 GGA TCC ACA TAA TGG TTC GCT TTT CAA CAG CC 
Primer 6 CTC GAG TTA TTC GCT CGA TAA TTT GC 

5 A12 Acyl Lipid desaturase, Pt_desl2.2 

Primer 7 GGA TCC ACA TAA TGG GTA AGG GAG GTC AAC G 
Primer 8 CTC GAG TCA TGC GGC TTT GTT TCG C 

Das PGR Fragment (1505bp) wurde mithilfe des Sure Clone 
10 Kit (Pharmacia) in pUC 18 kloniert, das inserierte Fragment 
BamHI/XhoI verdaut und das Fragment mithilfe entsprechender 
Restriktionsschnittstellen in pyES2 oder pYES6 inseriert. 

Die Plasmid-DNA wurde mit Restriktionsenzym/en passend zur 
15 eingefiihrten Schnittstelle der Primersequenz gespalten \ind 
das erhaltene Fragment in die kompatiblen Restriktionsstellen 
^es dephosphorylierten Hefe-E. coli-Shuttlevektors pYES2 oder 
pYES6 ligiert, wobei pYES-Derivate erhalten werden. Nach der 
Transformation von E. coli und DNA-Minipraparation aus den 
20 Transf ormanden wurde die Orientieriing des DNA-Fragments im 

Vektor durch geeignete Restriktionsspaltung oder Sequenzierung 
uherpruft. Ein Klon wurde ftir die DNA-Maxipraparation mit dem 
Nucleobond® AX 500 Plasmid-DNA-Extraktionskit (Macherey-Nagel, 
Duringen) angezogen. 

25 

Saccharomyces cerevisiae INVScl wurde mit den pYES-Derivaten 
und pYES Leervektor mittels eines PEG/Lithiumacetat:-Protokolls 
transformiert (Aus\ibel et al., 1995). Nach der Selektion 
auf CMdum-Agarplatten mit 2 % Glucose wurden pYES-Derivate- 
30 Transf ormanden und eine pYES2-Transf ormande zur weiteren Anzucht 
und funktionellen Expression ausgew^lt, Bei pYESG-Derivaten 
wurde Blasticidin als AntimetcQ>olit verwendet. Im Fall von 
Goexpressionen auf Basis von pYES2 \md pYES6 wurde auf Minimal- 
medium mit Blasticidin selektiert. 

35 

Funktionelle Expression einer Desaturaseaktivit^t in Hef e 
Vorkultur 

40 20 ml CMdum-Fliissigmedium ohne Uracil aber mit 2 % (Gew./Vol.) 
Raffinose wurden mit den transgenen Hefeklonen (pYES2) angeimpft 
und 3 Tage bei 30°C, 200 rpm gezQchtet, bis eine optische Dichte 
bei 600 nm (ODeoo) von 1,5 bis 2 erreicht wurde. WUrde als Vektor 
pYESG verwendet, so wurde zus^tzlich auf Blasticidin als Anti- 

45 metabolit selektioniert . 
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Hauptkultur 

Fiir die Expression wurden 20 ml CMdum-Flussiginedium ohne Uracil 
aber mit 2 % Raffinose iind 1 % (Vol. /Vol.) Tergitol NP-40 
5 mit Fettsauresubstraten auf eine Endkonzentration von 0,003 % 
(Gew./Vol.) angereichert . Die Medien wurden mit den Vorkulturen 
auf eine ODeoo von 0,05 angeimpft. Die Expression wurde bei einer 
ODeoo von 0,2 mit 2 % (Gew./Vol.) Galaktose filr 16 Std. induziert, 
wonach die Kulturen eine ODeoo von 0,8-1,2 geemtet wurden. 

10 

Fettsaureanalyse 

Die Gesamt-Fettsauren wurden aus Hefekulturen extrahiert und 
mittels Gaschromatographie analysiert. Davon wurden Zellen von 5 

15 ml Kultur mittels Zentrifugation (1000 x g, 10 min, 4''C) geerntet 
und einmal init 100 mM NaHCOa, pH 8,0,. gewaschen, urn restliches 
Medium und Fetts^uren zu entfernen. Zur Herstellung des Fett- 
sa\iremethylester (FAMES oder Singular FAME) wurden die Zell- 
sedimente mit 1 M methanolischer H2SO4 und 2 % (Vol. /Vol.) 

20 Dimethoxypropan ftir 1 Std. bei 80**C behandelt. Die FAMES wurden 
zweimal mit 2 ml Petrolether extrahiert, einmal mit 100 mM NaHCOs/ 
pH 8,0; und einmal mit destilliertem Wasaer gewaschen und mit 
Na2S04 getrocknet. Das organische Los.ungsmittel wurde unter einem 
Argons trom verdampft, und die FAMES wurden in 50 mikrol Petrol- 

25 ether gelost . Die Proben wurden auf einer ZEBRON-ZB-Wax-Kapillar- 
saule (30 m, 0,32 mm, 0,25 mikro m; Phenomenex) in einem Hewlett 
Packard-6850-~Gaschromatograph mit einem Plammenionisations- 
detektor aufgetrennt. Die Of en temp era tur wurde von 70^*0 (1 min 
halten) bis 200°C mit einer Rate von 20*'C/min, dann auf 250^*0 

30 (5 min halten) mit einer Rate von 5°C/min und schlie£lich auf 
260^*0 mit einer Rate von 5°C/min programmiert . Stickstoff wurde 
als Tragergas verwendet (4,5 nl/min bei TO'^C) . Die FettsSuren 
wurden durch Vergleich mit Retentions zeiten von FAME-Standards 
(SIGMA) identif iziert . 

35 

Expr es s ionsanaly se 

Die Verbal tnisse der zugegebenen und aufgenommenen Fetts^ure- 
substrate wurden enoittelt und so Quantitat und Qualitat der 
40 Desaturasereaktion gemafi Tabelle 6, Tabelle 7 und Tabelle 8 
erf asst. 

Ergebnis der Expression einer Phaeodactylum tricomutum A-6-Acyl 
Lipid Desaturase in Hefe: 

45 



wo 02/057464 



PCT/EP02/00461 



107 

Tabelle 6 



Fettsaure 


pYes2 


pyes2-Ptd6 gefiittert mit 








•1-18:2 


+18 : 3 


16:0 


13,3 


18,9 


28,4 


16,7 


16:1A9 


45,4 


44,7 


12,5 


16,9 


16:2A6,9 




4,3 






18:0 


4,9 


6,3 


10,4 


9,1 


18:1A9 


36,4 


24,1 


6,8 


11,8 


18:2A6,9 




1,8 






18:2A9,12 






33,4 




18:3A6,12,15 






4,9 




18:3A9,12,15 








43,1 


18:4A6,9,12,15 








2,3 



15 Die Angabetx stellen Mol-% entsprechender cis-Fettsauren dar. 

Ergebnis der Expression einer Phaeodactylum tricomutum A-5-Acyl 
Lipid Desaturase in Hefe: 



20 Tabelle 7 





pYES2 




pYES_PtD5-Konstrukt gefttttert mit . 






Fett- 


Kon-. 
















Selure Leer 


trollel8:2 18:3 


20:1 


-20:1 


20:2 


20:3 


20:3 


25 








A8 


All 


All,14 


03 


Q.6 


16:0A 16,9 


20,4 


27,7 24,4 


16,2 


21 


17,6 


19,5 


22,8 




16:1A9 44,7 


44,1 


13,2 9,6 


37,4 


39,4 


38,3 


36,9 


30,7 




18:0 6,1 


6,9 


10,54 9,8 


4,7 


7,9 


6,3 


6,8 


8,2 




18:1A9 31,72 


28,1 


8,77 6 


15 


26 


29,5 


25,6 


21,1 


30 


18:2 A5, 9 


0,17 


0 0 


0 


0,09 


0,21 


0,09 


9 




18:2 A9, 12 




39,7 - 














18:3 A9, 12,15 




49,9 














20:1A8 






25,5 












20:1 All 








5,41 








35 


20:2A5,11 








0,21 










20:2 All, 14 










6,48 








20:3 AS, 11, 14 










0,76 








20:3 All, 14, 17 












9,83 






20:3A8,11,14 














13,61 


40 


20:4A5.11,14,17 












1,16 






20:4A5,8,11,14 














3,08 



Die Angaben stellen Mol-% FettsMiiren von cis-Fettsauren dar. 
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Aus weiteren Futterungsversuchen wurde gefunden, dass C18:1A9 in 
der Anwesenheit von C18:2A9,11 oder C18 :3 A9, 12, 15 oder C20:1A8 
Fettsauren nicht desaturiert wurde wahrend in Anwesenheit von 
C20:1A11, C20:2A11,14 \md C20 :3 A8, 11, 14 auch C18:l desaturiert 
5 wird. Ebenfalls keine Desaturierung erfolgte in Anwesenheit von 
C20:3 A8,ll,14. 

Bei Nutzung des Protease-def izienten Hefestammes Cl3ByS86 (Kirnze 
I. et al.; Biochemica et Biophysica Acta (1999) 1410:287-298) fttr 

10 die Expression der A-5-Desat\irase aus Phaeodactylum tricornutum 
auf Vollmedium mit Blasticidin wurde gefunden, dass C20:4 
A8,ll, 14,17 als Substrat der A-5-Desaturase mit 20 % Umsatzrate 
ebenso gut umgesetzt wurde wie C20:3 A8,ll,14. Alternativ konnen 
auch die Auxotrophieiaarker leu2/ ura3 oder his fur Genexpression 

15 genutzt werden. 

In einem weiteren Coexpressionsexperiment von A-5 Desaturase aus 
Phaeodactylum und A-6 Elongase aus Physcomitrella wurde der Stamm 
UTL7A (Warnecke et al., J, Biol. Chem. (1999) 
20 274(19) :13048-13059)benutzt, wobei die A-5 Desaturase ca 10 % 
C20:3 A8,ll,14 zu C20:4 A5,8,ll,14 uinsetzte. 

Weitere Filtterungs experiment e mit verschiedensten anderen 
Fettsauren allein oder in Kombination (z.B. LinolsSure, 20:3 
25 A-5, 11, 14-Fettsaure, alpha- oder gamma Linolensaure , Stearidon- 
saure, Arachidonsaure, Eicosapentaensaure etc.) konnen zur 
detaillierteren Bestatigung der SubstratspezifitSt und 
-Selektivitat dieser Desaturasen durchgeftLhrt werden. 

30 Tabelle 8; Ergebnis der Coxpression einer Phaeodactylum tri- 
cornutum A-5-Acyl Lipid Desaturase und einer A-6 
Elongase aus Moos in Hefe auf Basis der Expressions- 
vektoren pYes2 undpYesS 

35 pYes2-Elo pYes2-Elo and pYes6-Ptd5 

+18:3 +18:4 +18:3 +18:4 

16:0 15,0 14,8 15,6 15,1 

16:1A9 27,7 29,2 27,5 29,0 

18:0 5,6 6,3 5,7 6,4 

18:1A9 17,1 30,8 27,4 31,6 

18:3A6,9,12 7,60 - 7,8 

18:4A6,9,12,15 - 6,71 - 6,4 

20:3A8,11,14 15,92 - 13,55 

45 20:4A5,8,11,14 - - 1,31 

20:4A8,11,14,17 - • 11,4 - 10,31 

20:5A5,8,11,14,17 - - - 0,53 
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Aus den Substrat\3msetzungen geht hervor, dass die verwendete 
^»5_i;)esaturase aus Phaeodactylum vnd die A-6-Elongase aus 
Physcomitrella patens bzgl. der Substrataktivitat und ins- 
besondere der Substratspezifitelt geeignet sind, urn Arachidon- 
5 saure bzw. Eicosapentaensaure xoithilfe erfindungsgemafier 
Sequenzen ru produzieren. 

Die Fragmentierxingsmuster und Massenspektren von DMOX-Derivaten 
von Standards als auch den Peakf raktionen per GC identif izierter 
10 Fettsauren der in Tabelle 6, 1 und 8 aufgefiihrten, zeigen 
vergleichsweise identische Ergebnisse, wodurch die jeweilige 
Position der Doppelbindiing tiber die bloiSe GC-Detektion hinaus 
abgesichert wurde. 

15 Beispiel 18: Reinigung des gewtinschten Produktes aus 
transformierten Organismen 

Die Gewinnung des gewiinschten Produktes aus Pf lanzeratiaterial oder 
Pilzen, Algen, Ciliaten, tierischen Zellen oder aus dem tJberstand 

20 der vorstehend beschriebenen Kulturen kann durch verschiedene, 
im Fachgebiet bekannte Verfahren erfolgen. Wird das gewiinschte 
Produkt nicht aus den Zellen sezerniert, konnen die Zellen aus 
der Kultur durch langsame Zentrifugation geemtet werden, die 
Zellen konnen durch Standardtechniken, wie mechanische Kraft oder 

25 Ultraschallbehandlung, lysiert werden, Organe von Pflanzen kSnnen 
mechanisch von andereiti Gewebe oder anderen Organen getrennt 
werden. Nach der Hoiaogenisation werden die Zelltriinnaer durch 
Zentrifugation entfemt, und die Uberstandsfraktion, welche 
die laslichen Proteine enthalt, wird zur weiteren Reinigung 

30 der gewiinschten Verbindung aufbewahrt. Wird das Produkt aus 
gewOnschten Zellen sezerniert, werden die Zellen durch langsame 
Zentrifugation aus der Kultur entfemt, und die XTberstands- 
fraktion wird zur weiteren Reinigung aufbewahrt. 

35 Die Uberstandsfraktion aus jedem Reinigungsverfahren wird einer 
Chromatographie mit einem geeignet en Harz unterworfen, wobei das 
gewUnschte Molekiil entweder auf dem Chromatographieharz zurtick- 
gehalten wird, viele Verunreinigungen in der Probe jedoch nicht, 
Oder die Verunreinigungen auf dem Harz zurtlckbleiben, die Probe 

40 hingegen nicht. Diese Chromatographieschritte k5nnen wenn notig 
wiederholt werden, wobei die gleichen oder andere Chroioato- 
graphieharze verwendet werden. Der Fachmann ist in der Auswahl 
geeigneter Chromatographieharze und ihrer wirksamsten Anwendung 
filr ein bestiirante's zu reinigendes Molekul bewandert. Das 

45 gereinigte Produkt kann durch Filtration oder Ultrafiltration 
konzentriert und bei einer Teitiperatur aufbewahrt werden, bei 
der die Stabilit^t des Produktes maximal ist. 
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Im Fachgebiet ist ein breites Spektrum an Reinigungsverfahren 
bekannt, und das vorstehende Reinigungsverfahren soli nicht 
beschrankend sein. Diese Reinigungsverfahren sind zum Bei- 
spiel beschrieben in Bailey, J.E. , & Ollis, D.F., Biochemical 
5 Engineering Fundamentals, McGraw-Hill: New York (1986). 

Die Identitat und Reinheit der isolierten Verbindungen kann 
durch Standardtechniken des Fachgebiets bestimmt werden. Dazu ge- 
horen Hochleistungs-Fliissigkeitschromatographie (HPLC) , spektro- 

10 skopische Verfahren, Farbeverfahren, Dunns chicht chromatographies 
insbesondere Diinnschichtchromatographie und Flamraenionisations- 
detektion {lATROSCAN, latron, Tokio, Japan), NIRS, Enzymtest oder 
mikrobiologisch. Eine Ubersicht tlber diese Analyseverfahren siehe 
in: Patek et al. (1994) Appl. Environ. Microbiol. 60:133-140; 

15 Malakhova et al. (1996) Biotekhnologiya 11:27-32; und Schmidt et 
al. (1998) Bioprocess Engineer. 19:67-70. Ulmann's Encyclopedia 
of Industrial Chemistry (1996) 3d. A27, VCH: Weinheim, S. 89-90, 
S. 521-540. S. 540-547, S. 559-566, 575-581 und S. 581-587; 
Michal, G (1999) Biochemical Pathways: An Atlas of Biochemistry 

20 and Molecular Biology, John Wiley and Sons; Fallon, A., et al. 
(1987) Applications of HPLC in Biochemistry in: Laboratory 
Techniques in Biochemistry and Molecular Biologyi Bd. 17. 

Aquivalente 

25 

Der Fachmann erkennt oder kaim viele Aquivalente der hier 
beschriebenen erfindungsgem§.Sen spezifischen Ausflihrungsformen 
feststellen, indem er lediglich Routineexperimente verwendet. 
Diese Aquivalente sollen von den Patentanspriichen umfasst sein. 

30 
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Patentanspriiche 

1. Expressionskassette mit einer Struktur ausgewahlt aus der 
5 Gruppe : 

a) LI - Promoter - Strukturgen - h2, 

b) LI - Promo tor - Strukturgen - L2 - Ll - Promoter - Struk- 
10 turgen - h2, 

c) LI - Promoter - Strukturgen - L2 ~ LI - Promoter - Struk- 
turgen - L2 - Li - Promotor - Strukturgen - L2, 

15 wobei LI, L2, Promotor und Strukturgen die folgende Bedeutung 
hat: 

LI = SEQ ID NO: 32 oder eine aquivalente Restriktionsschnitt- 
stellen enthaltende Sequenz, 
20 L2 = unabhangig voneinander SEQ ID NO: 33/ 34 oder 35 oder 

aquivalente Restriktionsschnittstellen enthaltende Se- 
quenz en, 

Promotor = pflanzlicher Promotor 
Strukturgen = eine in Pflanzen exprimierbare 
25 Nukleinsauresequenz . 

2. Expressionskassette nach Anspruch 1, wobei das Strxikturgen 
ein Biosynthesegen ist. 

30 3. Expressionskassette nach , Anspruch 1 oder 2, v/obei das Struk- 
turgen ein Biosynthesegen des Lipid- oder Fettsaurestof fwech- 
sels ist. 

4. Expressionskassette nach den Anspruche 1 bis 3, wobei das 
35 Strukturgen ein pflanzliches Gen ist. 
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5. Expressionskassette nach den Ansprtiche 1 bis 4; wobei das Gen 
eine Nukleinsauresequenz ist, die fur Proteine ausgewShlt aus 
der Gruppe : 

Acyl-CoA-Dehydrogenase(n) , Acyl-ACP[= acyl carrier protein] - 
5 Desaturase (n) , Acyl-ACP-Thioesterase (n) , Fettsaure-Acyl- 

Trancf erase (n) , FettsSure-Synthase (n) , Fettsaure-Hydroxy- 
lase (n) , Acetyl-Coenzym A-Ccu:boxylase (n) , Acyl-Coen- 
zym A-Oxidase (n) , FettsSure-Desaturase (n) , FettsSure- 
Acetyienasen, Lipoxygenasen, Triacylglycerol-Lipasen, 
10 Allenoxid-Synthasen, Hydroperoxid-Lyasen oder Fettsaure- 
Elongas€(n), kodiert. 



6, Expressionskassette nach den Anspruche 1 bis 5, v/obei das Gen 
eine NukleinsSuresequenz ausgewclhlt aus der Gruppe ist: 

15 

a) einer Nukleinsauresequenz rtiit der in SEQ ID NO; 1, 
SEQ ID NO: 3, SEQ ID NO: 5 Oder SEQ ID NO: 11 dar- 
gestellten Sequenz, 

20 b) Nukleinsauresequenzen, die aufgrund des degenerierten 

genetischen Codes durch RtLcktibersetzung der in 
SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 oder 
SEQ ID NO: 12 dargestellten Aminosaureseguenzen 
erhalten werden, 

25 

. c) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 
Oder SEQ ID NO: 11 dargestellten Nukleinsauresequenz, die 
fiir Polypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, 
SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten Aiainosaure- 
30 sequenzen codieren und mindestens 50 % Homologie au£ 

Aminos aureebene aufweisen, ohne da& die enzymatische 
Wirkung der Polypeptide wesentlich reduziert ist, 

7- Verwendung von Express ionskasset ten gemtS den Anspuchen 1 bis 
35 ■ 6 in einem Verfahren zur Herstellung von FettsMureestern mit 
einem erhohtem Gehalt an mehrf ach ungesattigten Fettsauren 
mit mindestens zwei Doppelbindungen dadurch gekennzeichnet , 
dafi man die Expressionskassette in einen Fettsaureester pro- 
duzierenden Organismus einbringt, anzieht und die in dera Or- 
40 ganismus enthaltenen Fettstureester isoliert. . 

8." Verfahren nach Anspruch 7, wobei die durch das Verfahren 

hergestellten Fettsaureester mehrf ach \ingesattigte Cis-/ C20- 
oder Caz'-F^ttsauremolekaie mit mindestens zwei Doppelbindungen 
45 im Fettsaureester enthalten. 
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9. Verfahren nach Anspruch 7 oder 8, wobei die Cis-^ oder 
C22-Fetts&ureir\olekule aus dem Organismus in Form eines Ols, 
Lipids isoliert werden. 

5 10. Verfahren nach den AnsprUchen 7 bis 9, wobei der Organismus 
eine transgene Pflanze ist. 

11. Verfahren nach den Anspruchen 7 bis 10, wobei die Fetts^ure- 
ester C18-, C20- oder C22-Fettsauren mit drei, vier oder ftinf 

10 Doppelbindungen im Fettsaureester enthalten. 

12. Verfahren nach den AnsprUchen 7 bis 11, dadurch gekenn- 
zeichnet, daS man die in den Fettsaureestern enthaltenden 
mehrfach ungesattigten Fettsauren freisetzt. 

15 

13. Vektor enthaltend eine Expressionskassette gemSS den Ansprti- 
Chen .1 bis 6. 

14. Organismus enthaltend mindes tens eine Expressionskassette ge- 
20 mas den Ansprtichen 1 bis 6 oder mindes tens einen Vektor gemafi 

Anspruch 13 . 

15. Organismus nach Anspruch 14, wobei.es sich bei dem Organismus 
um eine Pflanze handelt. 

25 

15. Transgene Pflanze enthaltend eine funktionelle oder nicht 

funktionelle NukleinsSuresequenz in einer Expressionskassette 
gem^fi den Ansprtichen 1 bis 6. 

30 17. Verwendung einer einer Expressionskassette gemaS den AnsprU- 
chen 1 bis 6 zur Herstellung von transgenen Pflanzen. 



35 



40 



45 
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Figur Is Polypeptidvergleich der Codierregionen von Pp^des 6 {obere 
Reihe) mit der EST-Sequenz von PT001078032R (untere Reihe) 

398 WKPLVWMAVTELMSGMIiLGFVFVLSHNGMEVYNSSKEFVSAQI VSTR 444 

W+ -1. + + + li +F LSHU + S-i- +A + V T 

430 WRVFGNIMLMGVAESLALAVLFSLSHN FESADRDPTAPLKKTGEPVDWFKTQVETS 253 

445 DIKGNIFmWFTGGLlSIRQIEHHLFPTMPRKJLNKIAPRVEVPCKKHGLVY 494 

G + FTGGLN Q+EHHLFP M lAP+V C KHG+ Y 

262 CTYGGFLSGCFTGGLNFQVEHHLFPRMSSAl^YXYIAPKVREIC^^ 113 



Figur 2 s Polypeptidvergleich von Codierregionen der Maudes 12 
(obere Sequenz) mit PT001070010R 

105 GVWVLAHECGHQSFSTSKTLNN 126 

G WVLAHECGH +FS +++L + 
533 GFWLAHECGHGAFSKNRSLQD 598 

Figur 2a: Polypeptidvergleich von Codierregionen der Ma_desl2 
(obere Sequenz) mit PT001072031R 

117 SPSTSKTLNNTVGWILHSKOiLVPYHSWRrSHSKHH 151 

++S S+T N+ VG+I+H LLVPY +W+ -^H^KHH 
465 AYSDSQTFNDWGFIVHQALLVPYFAWQYTHAKHH 569 



Figur 3; Polypeptidvergleich von Codierregionen eines PCR 

Produktes aus Primerpaar F6a und R4a2 codierend ftlr ein 
Desaturase Fragment (obere Reihe) aus Phaodactylum mit 
der Setjuenz T36617 aus Streptomyces coelicolor (untere 
Reihe) 

1 WWKNKHNGHHJ^VPinJICSSAVAQDGDPDIDTKD^ 60 
WW++KH HHA PN +D DPDI LL WS QA++ +GLi + 

114 WWQDKHTRHKANPN TEDLDPDIGP-DLLVWSPDQARAA TGLPRL 156 

61 MIRWQSYFYFPILLLARLSWLNESFKCAFGLGAASENAALELKAKGLQYPLLS^ 120 
+ R Q++ +FP+L L E F G A N L+ +A L+ A +L H 

157 LGRWQAFLFFPLLTL EGFNLHVASGRAMANRRLKRRA-r LDGALLLAH 202 

121 YAWMLWSSGFGRXXXXXXXXJOXXXXXXCGFLLAIVFGLGHNGMAln^ 180 

ALTF -GLFHGMAD RPDF + Q 

203 CAVYLTAL— FWVLPPCmiAFIAVHQCLFGVyLGSAFAPNHKGMPILTADDRPDFL^^ 260 
181 VTTTRNVTGGHGFPQAFV1}WFCGGLQYQVDHHLFPS 216 

V T+RNV GG F D GGL +Q++HHLFPS 

261 VLTSRNVNGG LFTDLALGGLNHQIEHHLFPS 291 
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Figur 4: Polypeptidvergleich von Codierregionen aus Pp_des6 
(obere Reihe) verglichen mit Pt_des6 (xintere Reihe) 

51 KRLTSKKRVSESAAVQCISAEVQRNSSTQCTAEALAESVVKPTRRRSSQW 100 

1 MGKGGDARASKG 12 

101 KKSTHPLS. .EVAVHNKPSDCWIVVKNKVYDVSNFADEHPGGSVIST^^ 148 

. :1 I! i 1 I Ih IIIIUII. IHIMI 1: I 
13 STAARKISWQEVKTHASPEDAWIIHSNKVYDVSNW.HEHPGGAVIFTHAG 61 

149 RDCTDVFSSFHISlASTWKILQDFYIGDV^ .ERVEPTPELL. . .K0FREMRA 193 

62 DDM-PDIFAAFHAPGSQSLMKKFYIGELLPETTGKEPQQIAFEKGYRDLRS 111 

194 LFLREQLFKSSKXiYYVMKLLTWAIFAASIAIICWSKTISAVrj^ACId^ 243 

: :M I M-IMI. I- I Mil h 

112 KLniMGMFKSNKWFYVYKCLSJ^IWAAACALVFifSDRFWVHLi^ 161 

244 LCFQQCGVJLSHDFLHNQVFSTRWLNEWGYVIGNAVLGFSTGWWKEKHNL 293 

III MMIIIMII I I M ■ hi III III 

162 TFFQQSGWLAHDFLHHQWTKRKHGDLGGLFWGNI^QGYSVQVWK^^ 211 

• • • • • 
294 HHAAPN.ECDQTY.QPIDEDIDTLPLIAWS KDILATVENKTFL 334 

111 111 11 illhlhlll I . 

212 HHAVPlin^HCSSAVAQDGDPDIDTOTI.liAWSVQQAQSYRELQADGKDSGliV 261 

335 R . ILQYQHLFFMGLLFFARGSWIiFWSWR YTSTAVLSPVDR. . . 373 

: I |: :| II III 1-= ^ II : 

262 KPKIRNQSYFYFPIIilARLSWLNESFKCMGLGAASENAALELK^ 311 

• • ■ • > 

374 . .LLEKGTVLFHYFWFVGTAC.YLLPGWKPLVWMAVTELMS.GMLLGFVF 419 

nil :| II I . • • . -I I I II II 

312 yPLLEKaGILLHyAMMLTVSSGPGRFSFAYTAPYPLTATASCGFLIAIVF 361 

, « * . • 

420 VLSHNGMEVYNSS. .KEFVSAQIVSTRDIKG NIFNDWFTGGLNRQ 462 

I nil II. :| h .11-: I I III III I 

362 GLGHNGMATniADARPDFWKLQVTTTRl^^^ 311 

463 lEHHLFPTMPRHNX^IAPRVEVFCKKHGLVYEDVSIATGTCICVLKALKE 512 

::|lll|.:il|ll I II III* h I : : II .|| i 

412 VDHHLFPSLPRHm*AKTHALVESFCKEWGVQYHEADLVTCTMEVLHH^^ 461 

513 VAEAAAEQHATTS 525 

II I 

462 VAGEFWDFVRDGPAM. 477 
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Figur 5: Polypeptidvergleich von Codierregioneti aus Pp_des6 
(obere Reihe) verglichen itiit Pt_des5 (untere Reihe) 



51 KRLTSKKRVSESAAVQCISAEVQRNSSTQGTAEALAESVVKPTRRRSSQ 100 
1 MAPDADKLRQRQTTAV 16 

101 KKSTHPIiSEVAVHNKPSDC V7IWKNKVYDVSNFADEHPGGSVIS 144 

I I . : : : HI- -I Hill I 

17 AK..HNAATISTQERLCSLSSLKGSEVCIDGIIYDLQSF..DHPGGETIK 62 

145 TYFGRDGTDVFSSPHAASTWKILQDF.YIGDVERVEPTPELLKDF.REM. 191 

: M I : I I I h :|l . :| ll- 

63 MFGGNDVTVQYKMIHPYHTEKHLEKMKRVGKVTDFVCEYKFDTEFEREIK 112 

192 RALFLREQLFKS.SKLYYVMKLLTNVAIPAASIAIICWSKT.ISAVI^A 239 

I .1 . I I : : I I I 

113 REVFKIVRRGKDFGTI^WFFRAFCYIAIF. .FYLQYHWVTTGTSl^^ 160 



240 Cl^MALCFQQCGWLSHDFLHNQVFETRWLNEWGYVIGNAVLGF 289 

•III. :| n ! M 

161 YGISQAMIGMN.VQHDANHGATSKRPWVNDMLG. .LGADFIGGSKWLV7QE 207 

290 KHNIJCHAAPNECDQTYQPIDEDIDTLPLIAWSKDILATVEl^ 339 

-.11111: I : I :|.| -= 

208 QHfrJTHHAYTNHAEM . . DP . . DSFGAEPMLIjFN . DYPLDHPARTWLH . . RF 250 



340 QHLFFMGLLFFARGSWLFWSWR YTSTAVLS . . . PVDRLLEKGTVL 381 

I hi -I III- II -I 

251 QAFFYMPVL. . . AGYWLSAVPNPQILDLQQRGALSVGIRLDNAFIHSRRK 297 

• • • • • 

382 FHYFW...FVG TACYLLPG WKPLVWMAVTELMSGMLLGFVFV 420 

: II 11 h . . . : 1 .1 

298 YAVFWRAVYIAVNVIAPFYTNSGLEWSWRWGNIMLMGVAESLALAV^^ 347 

421 LSHN . , .GMEVYNSSKEFVSAQIVSTRDIKGNIFNDWFTGGLN 460 

Mil I M I . MINI 

348 LSHNFESADRDPTAPLKKTGEPVDWFKTQ.VETSCTYGGFLSGCFTGGLN 396 

461 RQIBHHLFPTMPRHNLNKIAPRV3Ar?CKKHGLVYEDVS.IATGTCKVliKA 509 

hllllll I llhl 1 111- 1 i 

397 FQVEHHLFPRMSSAWYPYIAPKVREICAKHGVHYAYYPWIHQNFLSTVRY 446 

510 LKEVAEAAA.EQHATTS 525 

111. I 
447 MHAAGTGANWRQMARENPLTGRA. 469 
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Figur 6: Polypeptidvergleich von Codierregionen der A-12-Desatu- 
rase aus Mortierella alpina (Ma_desl2) obere Reihe mit 
der homologen Sequenz aus Phaeodactylum tricornutum 
(Pt_desl2) in der unteren Reihe 

40 KEIRECIPAHCFERSGLRGLCHVAIDLTWASLL. .FLAATQIDKFE. .NP 85 

h:| II 111 : I I -I • I : : II 

107 KDLRAVIPKDCFEPDTAKSLGYLSVS.TMGTILCSWGANIiLSVLDPSNP 155 

86 LIRYLAWPVYWIMQGIVCTGVWVLAHECGHQSFSTSKTLNNTVGWILHSM 135 

I : I I .1! Mllllllll Jl *:.| . Ihh'ih 
156 L.TOPLWAAYGAWGTVAMGLWVLAHECGHGAFSKNRSLQDAVGYIIHSI 204 

136 LLVPYHSWRISHSKHHKATGHMTKDQVFVPKTRSQVGLPPKENAAAAVQE 185 

:|||l II- II- II- I II ^ II -I I • i I 

205 M1,VPYPSWQRSHAVHHQYTNH14ELGETHVPDRADKEG EKSLALRQP 250 

186 EDMSVHLDEEAPIVTLFWMVIQFLFQ/7PAYLIMNASGQDYGRWTSHFHTY 235 

11. : : IIIIU:. M Mh 

251 MiDSFGKDKGMKAYGGLQSFLHLIVGWPAYLLIGATGGPDRGMTNHFYP. 299 

236 SPIFEP RNFF DIIISDLGVIiAALGALIYASMQLSLL'F/TK 275 

.|: I : I : Ihh I -1111 • I I 

300 NPLSTPTQPKKELFPGNWKEKVYQSDIGIAAVVGALIAWTATSCaijAPV^ 349 

276 YYIVPYLFVOTWLVLITFLQHTDPKLPHYREGAWNFQRGALCTVDRSFGK 325 

I. I : :| INI Mlill -Ih - II :|ll hll : I 
350 LYGGPLIVINAWLVLYTWLQHTDTDVPHFSSDNHNFVKGALHTIDRPYDK 399 

326 FLDHMFHGIVHTHVAHHLFSQMPFYHAEEATYHLKKLLGEYYVYD 370 

:| : li mill I .1 I h II :| I Ml 
400 LDPWGIIDFLHHKIGTTHVAHHFDSTIPHYKAQIATDAIKAKFPEVynYD 449 

371 PSPIWAVWRSFRECRFVEDQGDWFFK 398 

Ml Ml : I II -11 -I 
450 PTPIPQAMWRVAKGCTAVEQRGDAWVWK 477 
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Figiir 7: Polypeptidvergleich von Codierregionen der A-12- 
Desaturase aus Mortierella alpina (Ma_desl2) obere 
Reihe mit der homologen Sequenz aus Phaeodactylum tri- 
comutTjm Klon PT001072031R (Pt_desl2.2) in der unteren 
Reihe . 

22 NSAKPAFERNYQLPEFTIKEIRECIPAHCPERSGLRGLCHVAIDLTWASIj 71 

-I I . . :ll I :h II l|:|l II L 

33 SSYNPLAKDSPELP. .TKGQIKAVIPKECFQRSAFWSTFYLI^IAMS^ 80 

72 r»FI»AATQIDKFENP LIRYLAWPVYWIMQGIVCTGVWVLAHECGH 115 

.|: : I I I! II I : II IMIIIII 

81 FC:YGTSQVLSTDIiPQDATLILPWALGWG\r/AFWMGTILTGFVrWAHHCGH 130 

116 QSFSTSKTLNNTVGWILHSMLLVPYHSWRISHSKHHKATGHMTKDQVFVP 165 

.:| M N II. I. I lllll .|. .Mil: I |: : 1| 
131 GAYSDSQTFNDWGFIVHQALLVPYFAWQYTHAKHHRRTNHLVDGESHVP 180 

166 KTRSQVGLPP. .KENAAAAVQEEDMSVHLDEEAPIVTLFWMVIQFLFGWP 213. 

I II I . |. I 1 I : I I I III 

181 STAKDNGLGPHNERNSFYAAWHEAMG DGAFAVFQVWS . . HLFVGWP 224 

, • • • • 

214 AYLI.MNASGQ. .DYGRW TSHFHTYSPIFEPRWPFDIIISDLG 253 

M : ..|. I I II IM : I U 

225 LYLAGLASTGKLAHEGWWLEERNAIADHFRPSSPMFPAKIR2^IALSSAT 274 

254 VIJ^GALIYASMQLSLLTVTKYYIVPYLFVNFWLVLITFLQHTDPKLPH 303. 

IN hi I • II H 1 1 1 1 1 1 1 1 1 I . II 1 1 m I I 

275 ELAVIiAGLLYVGTQVGHLP\ajLWYWGPYTFVNAWLVLY'n'7LQHTDPSIPH 324 . 

304 YREGAWNFQRGALCTVDRSFGKFLDHMFHGIVHTHVAHHLFSQMPFYHAE 353 

I ill - :||l hll H I I II III Mil :||.M 
325 YGEGEWTWVKGALSTIDRDYGIF.DFFHHTIGSTHWHHLFHEMPtmiAG 373 

• • ■ • 

354 EATYHLKKIiGE. .YYVYDPSPIVVAWRSFRECRFVEDQGDVVFFK 398 

M .|. I I III. I Ml M :|l I :M 

374 IATQKVTCEFLEPQGLYim)PTPWYKAMWRIARTCHYVESNEGVQYFK 420 
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SEQUENZPRCTOKOLL 

<110> BASF Plant Science GmbH 

<120> Verfahren sur Expression von Biosynthesegenen. in 
pflanzlichen Sanen ^anter Verv;endung von neuen 
multiplane SxpressicnsJconstruktan 

<130> 2000^904 

<14a> 2000.904 
<141> 2000-12-22 

<160> 35 • 

<170> Patentin Vers. 2.0 

<210> 1 
<211> 1552 
<212> DNA 

<213> Phaeodactylun tricomutujt. 

<220> 
<221> CDS 

<222> (115) . . (1524) . 

<400> 1 ■ ; 

gacccaacaa acccaacaac cccaacaatc ccatcaacag gaattgggtu tcgttgagtc 60 

aataattgct agaatccaaa cagacagaca gagaccaacc gcatctatta caga atg 117 . 

24et 
1 

get ccg g&z gcg gat aag ctt cga caa crc cag acg act gcg gta gcg 165 
Ala Pro Ast> Ala Asp Z.ys Leu Arg Gin Arg Gin Thr Thr Ala Val Ala 
5 10 15 

aag cac aat get get acc ata teg acg cag gaa cgc ctt tgc agt ctg ' 213 
Lys His Asn Ala Ala Thr lie Ser Thr Gin Glu Arg Leu Cys Ser Leu 
20 25 30 

tct. teg etc aaa ggc gaa gaa gtc tgc ate gac gga ate ate tat gac 2 61 
Ser Ser. Leu Lys Gly Glu Glu Val Cys lie Asp Gly lie lie Tyr Asp 
35 40 45 

etc caa tea ttc gat cat ccc ggg ggt gaa acg ate aaa atg ttt ggt 3 09 
Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr lie Lys Met Phe Gly 
50 55 60 65 

ggc aac gat gtc act gta cag ::ac aag atg att cac ccg tac c&z acc 357 
Gly Asn Asp val Thr Val Gin Tyr Lys I'let lie His Pro Tyr His Thr 
70 75 80 

gag aag eat ttg gaa aag atg aag cgt gtc ggc aag gtg acg gat -tc 405 
Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp Phe 
85 90 95 

gtc tgc gag tac aag ttc gaz acc gaa ttt gaa cgc gaa ate aaa cga 453 



Val Cys Glu Tyr Lys Phe Asp Thr Glu Phe Gin Arg Glu He Lys Arg 
100 105 110 

gaa gtc ttc aag att gtg cga cga ggc aag gat ttc ggt act ttg gga 501 
Glu Val Phe Lys He Val Arg Arg Gly Lys Asp Phe Gly Thr Leu Gly 
115 120 125 

tgg ttc ttc cgt gcg ttt tgc tac att gcc att ttc ttc tac ctg cag 549 
Trp Phe Phe Arg Ala Phe Cys Tyr He Ala He Phe Phe Tyr Leu Gin 
130 135 140 ' * 145. 

tac cat tgg gtc acc acg gga acc tot tgg ctg ctg gcc gtg gcc tac 597 
Tyr His Trp Val Thr Thr Gly Thr Ser Trp Leu Leu Ala Val Ala Tyr 
150 155 160 

gga ate tec caa gcg atg att ggc atg aat gtc cag cac gat gcc aac "645 
Gly Hp Ser Gin Ala Ifet He Gly Met Aen Val Gin His Asp Ala Asn 
165 170 175 

cac ggg gcc acc tec aag cgt ccc tgg gtc aac gac atg eta ggc etc • 693 
His Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp Met Leu Gly Leu . 
180 ' 185 190 

ggt gcg gat ttt att ggt ggt tec aag tgg etc tgg cag gaa caa cac 741 
Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin His 
•195 . 200 205 

tgg acc cac cac get tac ace aat cac gcc gag atg gat ccc gat age 789 
Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp Ser 
210 215 ' 22Q 225 

ttt ggt gcc gaa cca atg etc eta ttc aac gac tat ccc ttg gat cat - 837 
Phe Gly Ala- Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp His 

230 235 * 240 ' 

ccc get cgt acc tgg eta cat cgc ttt caa gca ttc ttt tac atg ccc 885 
Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met Pro 
245 250 255 

gtc ttg get gga tac tgg ttg tec get gtc ttc aat cca caa att ctt 933 
Val Leu Ala Gly Tyr Tip Leu Ser Ala Val Phe Asn Pro Gin He Leu . 
260 265 270 

gac etc cag caa cgc ggc gca ctt tec gtc ggt ate cgt etc gac aac 981 
Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp Asn ■ 
275 ' 280 285 

get ttc att cac teg cga cgc aag tat gcg gtt ttc tgg egg get gtg 1029 
Ala Phe He His Ser Arg Arg Lys Tyr Ala Val Phe Trp Arg Ala Val 
290 295 300 305 

' \'\'' ' 
tac att gcg gtg aac gtg att get ccg ttt tac aca aac tec ggc etc 1077 
Tyr He Ala Val Asn Val He* Ala Pro Phe Tyr Thr Asn Ser Gly Leu 
310 315 320 

gaa tgg tec tgg cgt gtc ttt gga aac ate atg etc atg ggt gtg gcg 1125 
Glu Trp Ser Tip Arg Val Phe Gly Asn He Met Leu Met Gly Val Ala 
325 330 335 
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gaa teg etc gcg ctg gcg gtc ctg ttt teg ttg teg cae aat ttc gaa 1173 
61u Ser Leu Ala lieu Ala Val; Leu Phe Ser Leu Ser His Asn Phe Glu 
340 345 350 

tec gcg gat cgc gat ccg acc gcc cca ctg aaa aag acg gga gaa eea 1221 
Ser Ala Asp Arg Asp Pro "Thr Ala Pro Leu Lys Lys Thr Gly Glu Pro 
355 360 365 

gtc gac tgg ttc aag aca cag gtc gaa act tec tge act tae ggt gga 1269 
Val Asp Trp Phe Lys Thr Gin Val Glu Thr Ser Cys Thr Tyr Gly Gly 
370 . 375 380 385 

ttc ctt tec ggt tgc ttc acg gga ggt etc aac ttt cag gtt.gaa cac 1317 
Phe Leu Ser Gly Cys Phe Thr Gly Gly Leu Asn Phe Gin Val Glu His 
390 395 400 

cac ttg ttc cca cgc atg age age get tgg tat ccc tac att gee cce 1365 
His Leu Phe' Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr lie Ala Pro 
405 410 415 

aag gtc cgc gaa att tgc gcc aaa cac ggc gtc cac tac gcc tac tac . 1413 
Lys Val Arg Glu He Cys Ala Lys His Gly Val. His Tyr Ala TYr Tyr 
420 425 430 

ccg tgg ate cac caa aac ttt etc tee ace gtc cgc tac atg cac gcg 1461 
Pro Trp He His Gin Asn Phe Leu Ser Thr Val Arg Tyr. Met His Ala 
435 440 445 

gcc ggg acc ggt gcc aac tgg cgc cag atg gee aga gaa. aat ccc ttg 1509 
Ala Gly Thr Gly Ala Asn Trp Arg Gin Met Ala Arg Glu Asn Pro Leu 
450 455 460 465 

ace gga egg gcg taa aagtacaega cacgaccaaa ggtggcgtat ggtgatctct 1564 
Thr Gly Arg Ala 

470 • 

agaaaacaga catagectae tggaaatate gacgtccaaa eaataatttt aaagactatt 1624 
tttctgcgta aaaaaaaaaa aaa^aacia 1652 



<210> 2 
<211> 469 
<212> PRT 

<213> PhaeodactyJum tricomut\im 
<400> 2 ! . '• 

Met Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val 
1 5 . 10 ■ 15 

Ala Lys His Asn Ala Ala Thr He Ser Thr Gin Glu Arg Leu Cys Ser 
20 25 30 

Leu Ser Ser Leu Lys Gly Glu Glu Val Cys He Asp Gly He He Tyr 
35 40 45 

Asp Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr He Lys Met Phe 
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55 
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Gly Gly Asn Asp Val Tlir V^l Gin Tyr Lys Met lie His Pro Tyr .His 
65 70 .75 80 

Thr Glu Lys His Leu Glu Lys Met Lys Arg val Gly Lys val Uir* Asp 
85 . 90 95 

Phe Val Cys Glu Tyr Lys -Plie Asp Tiir Glu Phe Glu Arg Glu lie Lys 
100 105 110 

Arg Glu Val Phe Lys Xle Val Arg Arg Gly Lys Asp Phe Gly Olir Leu 
115 120 .125 

Gly Trp Phe Phe Arg Ala Phe Cys Tyr lie Ala He Phe Phe Tyr Leu 
130 . 135 140 

Gin Tyr His Trp Val Thr Thr Gly Thr Ser Trp Leu Leu Ala val Ala 
145 150 155 160 

Tyr Gly He Ser Gin Ala Met He Gly Met Asn Val Gin His Asp Ala 
165 170 ' 175 

Asn His Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp Met Leu Gly 
180 185 190 

Leu Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin 
195 2.00 205 ' 

His Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp 
210 215 220 

Ser Phe Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp 
225 230 * 235 240 

His Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met 
245 250 255 

Pro Val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He 
260 265^ 270 

Leu Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp 
275 280 . 285 

Asn Ala Phe He His Ser Arg Arg Lys Tyr Ala Val Phe Trp Arg Ala 
290 295 300 

val Tyr He Ala Val Asn Val He Ala Pro Phe Tyr Thr Asn Ser Gly 
305 310 315 ■ 320 

Leu Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val 
325 330 335 



Ala Glu Ser Leu Ala Leu Ala Val Leu Phe Ser Leu' Ser His Asn Phe 
340 345 350 



Glu Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu 
355 360 365 
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Pro Val Asp Trp Phe Lys Thr Gin 
370 375 

Gly Phe Leu Ser 61y Cys Phe Thr 
385 390 

His His Leu Phe Pro Arg Met Ser 
405 

Pro Lys Val Arg Glu lie Cys Ala 

420 

Tyr Pro Trp He His Gin Asn Phe 
435 440 

Ala Ala Gly Thr Gly Ala Asn Trp 
450 455 

Leu oair Gly Arg Ala 
465 



<210> 3 
<211> 1434 . 

<212> DNA - 

<213> Phaeodactylum tricomuttiia 

<220> 
<221> CDS 
<222> (1) , . (1434) 

<400> 3" 

atg ggc aaa gga ggg gac get egg gcc teg aag ggc 
Met Gly Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly 
1 5 • . . 10. 

cgc aag ate agt tgg cag gaa gtc aag ace cac gcg tct c eg gag gac 96 
Arg Lys He Ser Trp Gin Glu Val Lys Thr His Ala Ser Pro Glu Asp 
20 25 30 

gcc tgg ate att cac tec aat aag gtc tac gac gtg tec aac tgg cac . 144 
Ala Trp He He His Ser Asn Lys Val Tyr Asp Val Ser Asn Trp His 
35 -40 45 

gaa cat eee gga ggc gcc gtc att ttc aeg cac gcc ggt gac gac atg 192. 
Glu His Pro Gly Gly Ala Val He Phe Thr His Ala Gly Asp Asp Met 
50 55 60 . - 

acg gac att ttc get gcc ttt cac gca cce gga teg eag teg etc atg 240 
Thr Asp He Phe Ala Ala Phe His Ala Pro Gly , Ser Gin Ser Leu Met 
65 70 .75 • . 80 

aag aag ttc tac att ggc gaa ttg etc ccg gaa ace ace ggc aag gag 288 
Lys Lys Phe Tyr He Gly Glu Leu Leu Pro Glu Thr Thr Gly Lys Glu 
85 90 95 



Val Glu Thr Ser Cys Thr Tyr Gly 
• 380 

Gly Gly Leu Asn Phe Gin Val Glu 
395 400 

Ser Ala Trp Tyr Pro Tyr He Ala 
410 415 

Lys His Gly Val His Tyr Ala Tyr 
425 430 

Leu Ser Thr Val Arg Tyr Met His 
445 

Arg Gin Met Ala Arg Glu Asn Pro 
46a 



tea acg gcg get 48 
Ser Thr Ala Ala 
15 



ccg cag caa ate gcc ttt gaa ciag ggc tac cgc gat ctg cgc tec aaa 



336 
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Pro Gin Gin lie Ala Phe Glu Lys Gly Tyr Arg Asp Leu Arg Ser Lys 
100 105 110 

etc ate atg atg ggc atg ttc aag tee aac aag tgg ttc tac gtc tac 384 
Leu lie Met Met Gly Met Phe Lys Ser Asn Lys Trp Phe Tyr Val Tyr 
115 120 125 

aag tgc etc age aac atg gee att tgg gee gee gee tgt get etc gtc 432 
Lys Cys Leu Ser Asn Met Ala lie Trp Ala Ala Ala Cys Ala Leu Val 
130 135 140 

ttt tac teg gae cgc ttc tgg gta cae ctg gee age gee gtc atg ctg 480 
Phe Tyr Ser Asp Arg Phe Trp Val His Leu Ala Ser Ala Val Met Leu 
145 150 155 160 

gga aca ttc ttt cag eag teg gga tgg ttg gea cac gae ttt ctg cac 528 
Gly Thr Phe Phe Gin Gin Ser Gly Tip Leu Ala Hia Asp Phe Leu His 
165 170 175 • 

cac cag gtc ttc acc aag cgc aag cac ggg gat etc gga gga etc ttt 576 
His Gin Val Phe Thr Lys Arg Lys His Gly Asp Leu Gly Gly Leu Ph^e 
180 185 190 

tgg ggg aac etc atg cag ggt tac tec gta cag tgg tgg aaa aac aag 624 
Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp Lys Asn Lys 
195 2.00 205 

cac , aac gga cac cac gee gtc cec aac etc cac tgc tee tec gea gtc 672 . 
His Asn Gly His His Ala Val Pro. Asn Leu His Cys Ser Ser Ala Val 
210 ' ' 215 . . 220 • . 

gcg caa gat ggg gae ccg gae ate gat acc atg cec ctt etc gcc tgg 720 
Ala Gin Asp Gly Asp Pro Asp He Asp Thr Met Pro Leu Leu Ala Trp 

225 ' 230 235 240 ; \ 

tec gtc cag caa gcc cag tct tac egg gaa etc caa gcc gae gga aag 768 
Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu Gin Ala Asp Gly Lys 
.245 250 255 

gat teg ggt ttg gtc aag ttc atg ate cgt aac caa tee tac ttt tac 816 
Asp Ser Gly Leu Val Lys Phe Met lie Arg Asn Gin Ser Tyr Phe Tyr 
260 265 270 

• ttt cec ate ttg ttg etc gcc cgc ctg teg tgg ttg aac gag tec ttc 864 - 
Phe Pro lie Leu Leu Leu Ala Arg Leu Ser. Trp Leu Asn Glu Ser Phe 
275 280 285 

aag tgc gcc ttt ggg ctt gga get gcg teg gag aac get get etc gaa 912 
Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala Ala Leu Glu 
.290 • • 295 300 ... 

etc aag gcc aag ggt ctt cag tac cec ctt ttg gaa aag get ggc ate 960 
Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu Glu Lys Ala Gly He 

305 310 315 * 320 

ctg ctg cac tac. get tgg atg ctt aca gtt teg tec ggc ttt gga cgc 1008 
Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser Ser Gly Phe Gly Arg 
325 • 330 335 
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ttc teg ttc gcg tac acc gca ttt tac ttt eta acc gcg acc gcg tec 1056 
Pile Ser Phe Ala Tyr OSir Ala Phe Tyr Phe Leu Thr Ala Thr Ala Ser 
340 345 350 

tgt gga ttc ttg etc gee att gtc ttt ggc etc gge cac aac ggc atg 1104 

Cys Gly Phe Leu Leu Ala He Val Phe Gly Leu Gly His Asn Gly Met 
355 ' 360 365 

V 

gee acc tac aat gee gac gee cgt ecg gac ttc tgg aag etc caa gtc 1152 

Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe Trp Lys Leu Gin Val 
370 375 * 380 



ace acg act cgc aac gtc acg ggc gga cac ggt ttc ccc caa gee ttt 1200 
Thr ThTj.Thr Arg Asn Val Thr Gly Gly His Gly Phe Pro Gin Ala Phe 
385 390 395 400 

gtc gac tgg ttc tgt ggt ggc etc cag tac caa gtc gac cac cac tta 1248 
Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin Val Asp His His Leu " 
405 ' 410 415 

ttc ccc age ctg ccc cga cac aat ctg gee aag aca cac gca ctg gtc 1296 
Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His Ala Leu Val 
420 ' 425 430 

gaa teg ttc tgc aag gag tgg ggt gtc cag tac cac gaa gee gac ctt 1344 
Glu Ser Phe Cys Lys Glu Trp Gly Val Gin Tyr His Glu Ala Asp Leu 
. • 435 ■ 440 . 445 

gtg gac ggg acc atg gaa gtc ttg cac cat ttg ggc age gtg gee ggc 1392 
Val Asp Gly Thr Met Glu Val Leu His His Leu Gly Ser Val Ala Gly 
450 455 460 

gaa ttc gtc gtg gat ttt gta cgc gat gga ccc gcc atg taa 1434 
Glu Phe Val Val Asp Phe Val Arg Asp Gly Pro Ala Met 
465 470 475 



<210> 4 
<211> 477 
<2a2> PRT 

<213> Phaeodactylum tricomutum 
<400> 4 

Met Gly. Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly Ser Thr Ala Ala 
1 5 .10-15 

Arg Lys He Ser Trp Gin Glu Val Lys Thr His Ala Ser Fro Glu Asp 
20 25 30 

Ala Trp He He His Ser Asn Lys Val Tyr Asp Val Ser Asn Trp His 
35 ' 40 . 45 • 

Glu His Pro Gly Gly Ala Val He Phe Thr His Ala Gly Asp Asp Met 
50 55 60 

Thr Asp He Phe Ala Ala Phe His Ala Pro Gly Ser Gin Ser Leu Met 
65 70 75 80 
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Lys Lys Phe Tyr He Gly Glu Leu Leu Pro Glu Thr Thr Gly Lys Glu 
85 90 95 

Pro Gin Gin lie Ala iPhe Glu Lys Gly Tyr Arg Aep Leu Arg Ser Lys 
100 105 110 

Leu He Met Met Gly Met Phe Lys Ser Asn Lys Trp Phe Tyr Val Tyr 
115 120 125 

Lys Cya Leu Ser Asn Met Ala He Trp Ala Ala Ala Cys Ala Leu Val 
130 ' 135 140 

Phe Tyr Ser Asp Arg Phe Trp Val His Leu Ala Ser Ala Val Met Leu 
145 150 155 160 

Gly Thr Phe Phe Gin Gin Ser Gly Trp Leu Ala His- Asp Phe Leu His 
165 • 170 175 

His Gin Val Phe Thr Lys- Arg Lys His Gly Asp Leu . Gly Gly Leu Phe 
180 185 . 190 

Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp Lys Asn Lys 
195 200 205 

His Asn Gly His His Ala Val P;^o Asn Leu His Cys Ser Ser Ala Val 
210 : 215 - 220 

Ala Gin Asp Gly Asp Pro Asp lie Asp Thr Met Pro Leu Leu Ala Trp 
•225 230 • 235 240 

Ser Val Gin Gin Ala Gin Ser IVr Arg Glu Leu Gin Ala Asp Gly Lys 
245 250 255 

Asp Ser Gly Leu Val Lys Phe Met He Arg Asn Gin Ser Tyr Phe Tyr 
260 265 -270 

Phe Pro He Leu Leu Leu . Ala Arg Leu Ser Trp Leu Asn Glu Ser Phe 

275 280 285 . 

Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala Ala. Leu Glu 
290 295 300 

Leu Lys Ala Lys Gly Leu Gin Tyr* Pro Leu Leu Glu Lys Ala Gly He 
305 310 315 320 

Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser Ser Gly Phe Gly Arg 
325 330 335 

Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu Tlir Ala Thr Ala Ser 
340 345 350 

Cys Gly Phe Leu Leu Ala He Val Phe Gly Leu Gly His Asn Gly Met 

■355 360 365 



Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe Trp Lys Leu Gin Val 
370 375 380 



Thr Thr Ihr Arg Asn Val Thr Gly GLy His Gly Plae Pro Gin Ala Phe 
385 390 395 400 

Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin Val Asp His His Leu 
405 410 415 

Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His Ala Leu val 
420 * 425 430 

Glu Ser Phe Cys Lys Glu Trp Gly Val Gin Tyr His Glu Ala Asp Leu 
435 440 445 

Val Asp Gly Thr Met Glu Val Leu His His Leu Gly Ser Val Ala Gly 

450 455 460 

Glu Phe Val Val Asp Phe val Arg Asp Gly Pro Ala Met 
465 470 475 



<210> 5 • 
<211> 1651 
<212>'DNA 

<213> Phaeodactylum tricomutum 

<220> 

<221> CDS- 

<222> (67)..(1554) 

<400> 5 . , - 

gaagaaggaa catataaaag taagccatct . cctcggcacc atctaaagac ctaatatcta 60 

ctcgtc atg gtt cgc ttt tea aca gcc get eta ett tct etg teg aca 108 
Het Val Arg Phe Ser Thr Ala Ala Leu Leu Ser Leu Ser Thr 

1 . 5 . 10 

ttg aca act tea tgt att ggt gcc ttc cag ctg tct teg cca gca caa 156 
Leu Thr Thr Ser Cys lie Gly Ala Phe Gin lieu Ser Ser Pro Ala Gin 
15 20 " 25 30 . 

ctt ccg aca agt agg ett cgt egg cat acg aac acg gcg eeg ett teg 204 
Leu Pro Thr' Ser Arg Leu Arg Arg His Thr Asn Thr Ala Pro Leu Ser 
35 .40 45 

gee gtg gee gtc gac tee ggt tct tec gat eeg gcc ttg gta ggc aac 252 
Aia Val Ala Val Asp Ser Gly Ser Ser Asp Pro Ala Leu Val Gly Asn 
50 55 * 60 

etc ccc ctt ccc aac aac aat gat aat gag gac aag aac cgt aga atg 300 
Leu Pro Leu Pro Asn Asn Asn Asp Asn Glu Asp Lys Asn Arg Arg Met 
65 70 ' 75 

cca atg atg gac ttg aaa ggt att get ctg tct ggt etc aaa ggg caa 348 
Pro Met Met Asp Leu Lys Gly lie Ala Leu Ser Gly Leu Lys Gly Gin 
80 85 . 90 



get ctt tec gtc cga gcg gaa gat ttt cct cag gcg aaa gac ttg cgt 
Ala Leu Ser Val -Arg Ala Glu Asip Phe Pro Gin Ala Lys Asp Leu Arg 
95 100 105 110 



396 
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gcc gtc att ccg aaa gat tgc ttc gaa ccc gac acg gcc aaa teg ttg 444 
Ala Val He Pro Lys Asp Cys Phe Glu Pro Asp Thr Ala Lys Ser Leu 
115 120 125 

gga tat ctt tec gtt tea act atg ggg aca att etc tgc tec gtc gtc 492 
Gly Tyr Leu Ser Val Ser Thr Met Gly Thr He Leu Cye Ser Val Val 
130 135 140 

gge gcg aac etc ctt agt gtg etc gat ccc tec aat cca tta ace tgg 540 
Gly Ala Asn Leu Leu Ser Val Leu Asp Pro Ser Asn Pro Leu Thr Trp 
145 150 155 

ect etc tgg gcg gcc tac ggt gcc gtc acg ggg acg gtc gee atg ggg 588 
Pro Leu Trp Ala Ala Tyr Gly Ala Val Thr Gly Thr val Ala mt Gly 
150 . 165 . 170 

ctt tgg, gtg ctg gcc cac gaa tgc gga cac gge gee ttt tec aaa aac 636 
Leu Trp Val Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Lys Asn 
175 180 185 190 

cga tec etc eag gat gee gtg ggg tac att ate cat tec ate atg ctg 684 
Arg Ser Leu Gin Asp Ala Val Gly Tyr He He His Ser He Met Leu 
195 200 205 

gtg cca tac ttt agt tgg cag cga teg cat gcc gtg cat cac cag tat 732 
Val Pro Tyr Phe Ser Tarp Gin Arg Ser His Ala Val His His Gin Tyr 
• • 210 215 220 

acc aat cat atg gaa ctg ggg gaa aca cac gtt cct gat cga. gcc gat 780- 
Thr Asn His Met Glu Leu Gly Glu Thr His Val Pro Asp Arg Ala Asp 
225 230 235 

aag gag gge gag aag age ctg gcg etc cgc cag ttc atg ttg gat tec 828 
Lys Glu Gly Glu Lys Ser Leu Ala Leu Arg Gin Phe Met Leu Asp Ser 
240 245 250 

ttt ggt aaa gac aag gge atg- aaa gca tac gga gge etc cag teg ttt 876 
Phe Gly Lys Asp Lys Gly Met Lys Ala Tyr Gly Gly Leu Gin Ser Phe 
255 260 265 270 

ttg cat etc ate gtg gga tgg cca gcc tac etc ctg ate ggt gcg acc 924 
Leu His Leu He Val Gly Trp Pro Ala Tyr Leu Leu He Gly. Ala Thr 
275 280 285 

ggt gga ccc gac cgt ggt atg ace aac cat ttt tat ccc aac cct ttg. 972 
Gly Gly Pro Asp Arg Gly Met Thr Asn His Phe Tyr Pro Asn Pro Leu 
290 295 3.00' 

V • ■ 

teg acg cca aca cag ccc aag aaa gaa ctt ttc cct ggg aac tgg aaa 1020 
ser Thr Pro Thr Gin Pro Lys Lys Glu Leu Phe Pro Gly Asn Trp Lys 
305 310 315 ' 

gaa aag gtc tac cag tea gat att gga ate gcc gcc gtt gtc gge gee 1068 
Glu hys Val Tyr Gin Ser Asp He Gly He Ala Ala Val Val Gly Ala 
320 325 330 

etc att get tgg acc gcc act teg ggt eta gee ccc gtc atg gee ttg 1116 
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Leu lie Ala Trp Thr Ala Thr Ser Gly Leu Ala Pro Val Met Ala Leu 
335 340 345 350 

tac ggt ggt ccc ttg ate gtc att aat gcc tgg ctg gta ctg tac acg 1164 
Tyr Gly Gly Pro Leu lie Val lie Asn Ala Trp Leu Val Leu Tyr Thr 
355 360 365 

tgg ttg caa cat aca gat acc gat gtt ccg cac ttt tec tec gac aac 1212 
Trp Leu Gin His Thr Asp Thr Asp Val Pro His Phe Ser Ser Asp Asn 
370 375 380 

cac aac ttt gtc aag ggc gca ctg cat acg ate gat cgt ccc tac gac 1260 
His Asn Phe Val Lys Gly Ala Leu His Thr lie Asp Arg Pro Tyr Asp 
385 390 395 

aaa ctt gat ccc tgg gga ate ata gac ttt ctg cac cac aag att gga 1308 
Lys Leu Asp Pro Trp Gly lie lie Asp Phe Leu His His Lys He Gly 
400 405 ^ 410 

aca acg cat gtg gca cac cat ttt gac agt act ate ccc cac tat aag ' 1356 
Thr Thr His Val Ala His His Phe Asp Ser Thr He Pro His Tyr Lys 
415 • • 420 ' 425 430 

get cag att. get acc gat gcc ate aaa gcc aag ttt cca gaa gtg tac 1404 
Ala Gin He Ala Thr Asp Ala He Lys Ala Lys Phe Pro Glu Val Tyr 
435 440 445 

etc tat gac ccg aca cca att cca caa gcc atg tgg cgc gtc gcc aag 1452 
Leu Tyr Asp Pro Thr Pro He Pro Gin Ala Met .Trp Arg Val Ala Lys 

450 . ■ " " 'j 460 

gga tgt act gca gta gag .caa cgc ggt gac gcc tgg gtg tgg aaa aac 1500 
Gly Cys Thr Ala Val Glu Gin Arg Gly Asp Ala Trp Val- Trp Lys Asn 
.465 470 475 

. gaa gga ata gaa gat ttg gtg gaa cat cgt caa age aaa tta teg age 1548 
Glu Gly He Glu Asp Leu Val Glu His Arg Gin Ser Lys Leu Ser Ser' 
480 . - ; 485 490 

gaa taa agcaacatat cgctttatgg aagaaeaaac gteeattgtg taaaaccctg 1^9^ 
Glu 

495 • 

ataatttcaa tattgtgttt tgttttaaaa aaaaciaaaaa aaaaaaa 1651 



<210> 6 

<211> 495 • * 

<212> PRT 

<213> Phaeodaetyium trieomutum 
<400> 6 

Met Val Arg Phe Ser Thr Ala Ala Leu Leu Ser Leu Ser Thr Leu Thr 

1 5 " 10 15 



Thr Ser Cys He Gly Ala Phe Gin Leu Ser Ser Pro Ala Gin Leu Pro 
20 25 30 
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O^hr Ser Arg Leu Arg Arg His Thr Asn Thr Ala Pro Leu Ser Ala Val 
35 40 45 

Ala Val Asp Ser Gly Ser Ser Asp Pro Ala Leu Val Gly Asn Leu Pro 
50 55 60 

Leu Pro Asn Asn Asn Asp Asn Glu Asp Lys Asn Arg Arg Met Pro Met 
65 70 75 80 

Met Asp Leu Lys Gly lie Ala Leu Ser Gly Leu Lys Gly Gin Ala Leu 
85 90 . 95 

Ser Val Arg Ala Glu Asp Phe Pro Gin Ala Lys Asp Leu Arg Ala Val 
100 . 105 110 

lie Pro Lys Asp Cys Phe Glu Pro Asp Thr Ala Lys Ser Leu Gly Tyr 
115 • 120 125 

Leu Ser Val Ser Thr Met Gly Thr He Leu Cys Ser Val Val Gly Ala 
130 135 140 

Asn Leu Leu Ser Val Leu Asp Pro Ser Asn Pro Leu Thr Trp Pro Leu 
145 150 155 ' ' • 160 

Trp Ala Ala Tyr Gly Ala Val .Thr Gly Thr Val Ala Met* Gly Leu Trp 
165 170 175 

Val Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Lys Asn Arg Ser 
180 . ■ . 185 * 190 

Leu Gin Asp Ala Val Gly Tyr He He His Ser He Met Leu Val Pro 
195 200 205 

Tyr Phe Ser Trp Gin Arg S^r His Ala Val His His Gin Tyr Thr Asn 
210 215 220 

His Met Glu Leu Gly Glu Thr His Val Pro Asp Arg Ala Asp' Lys Glu 
225 .230 235 .240 

Gly Glu Lys Ser Leu Ala Leu Arg Gin Phe Met Leu Asp Ser Phe Gly 

245 250 255. 

Lys Asp Lys Gly Met Lys Ala Tyr Gly Gly Leu Gin Ser Phe Leu His 
260 265 270 

Leu He Val Gly Trp Pro Ala Tyr Leu Leu He Gly Ala Thr Gly Gly 
275 280 285 

Pro Asp Arg Gly Met Thr Asn His Phe Tyr Fro Asn Pro Leu Ser Thr 
290 295 300 

Pro Thr Gin Pro Lys Lys Glu Leu Phe Pro Gly Asn Trp Lys Glu Lys 
305 310 315 320 



Val Tyr Gin Ser Asp He. Gly He Ala Ala Val Val Gly Ala Leu He 
325 330 335 



Ala Trp Thr Ala Thr Ser Gly Leu Ala Pro Val Met Ala Leu Tyr Gly 
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340 



345 



350 



Gly Pro Leu He Val He Asn Ala Trp Leu Val Leu Tyr Thr Trp Leu 
355 360 365 

Gin His Thr Asp Thr Asp Val Pro His Phe.Ser Ser Asp Asn His Asn 

370 375 380 

Phe Val Lys Gly Ala Leu His Thr He Asp Arg"Pro Tyr Asp Lys Leu 
'385 • 390 395 400 

Asp Pro Trp Gly He He Asp Phe Leu His His Lys He Gly Thr Thr 
405 410 415 . 



•His Val Ala His His Phe Asp Ser Thr He Pro His Tyr Lys Ala Gin 
420 425 430 

He Ala Thr Asp Ala He Lys Ala Lys Phe Pro Glu Val .Tyr Leu Tyr 
435 440 445 

Asp Pro Thr Pro He Pro Gin Ala Met Trp Arg Val Ala Lys Gly Cys 
450 ' 455 460 

Thr Ala Val Glu Gin Arg Gly Asp Ala Trp Val Trp Lys Asn Glu Gly 
465 470 475 480 

He Glu Asp Leu Val Glu His Arg Gin Ser Lys Leu Ser Ser Glu 
485 490 495 



<210> 7 
<211> 1578 
<212> DNA 

<213> Physcoioitrella patens . . 

<220> 

<221> CDS 

<222> {1)..(1578) 

<400> 7 . 

atg gta ttc gcg ggc ggt gga ctt cag cag ggc tot etc gaa gaa aac 48 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
1 5 10 . 15 

ate gac gtc gag cac att gee agt atg tct etc ttc age gac ttc ttc 96 
He Asp Val Glu Eis He Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 
20 25 .30 

agt tat gtg tct tea act gtt ggt teg tgg age gta cae agt ata caa 144 
Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser He Gin 
35 . - 40 45 

cot ttg aag ege ctg acg agt aag aag cgt gtt teg gaa age get gee 192 
Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
50 55 60 



gtg caa tgt ata tea get gaa gtt cag aga aat teg agt aee cag gga 240 
Val Gin Cys He Ser Ala Glu val Gin Arg Asn Ser Ser Thr Gin Gly 
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65 70 75 80 

act gcg gag gca etc gca gaa tea gtc gtg aag ccc acg aga cga agg 288 
Thr Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Thr Arg Arg Arg 
85 90 95 

tea tct cag tgg aag aag teg aca cac ccc eta tea gaa gta gca gta 336 
Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
100 * 105 110 

cac aac aag cca age gat tgc tgg att gtt gta aaa aac aag gtg tat 384 
His Asn Lys Pro Ser Asp Cys Trp lie Val Val Lys Asn Lys Val Tyr 
115 120 125 

gat gtt tec aat ttt gcg gac gag cat ccc gga gga tea gtt att a:gt 432 
Asp val Ser Asn Phe Ala Asp Glu His Pro Gly Gly ser Val He Ser 
130 * ' 135 . 140 

act tat ttt gga cga gac ggc aca gat gtt ttc tct agt ttt cat gca 480 
Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val ' Phe Ser Ser Phe His Ala 
145 150 155 160 

get tct aca tgg aaa "att ctt caa gac ttt tac att ggt gac gtg gag 528 
Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
165 170 ' 175 

agg gtg gag ccg act cca gag ctg ctg aaa gat ttc cga gaa atg aga 576 
Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
180 185 190 

get ctt ttc ctg agg gag caa ctt ttc aaa agt teg aaa ttg tac tat 624 
Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
195 200 • 205 

gtt atg' aag "ctg etc acg aat gtt get att ttt get gcg age att gca ' 672 
Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 
210 215 . • 220 

ata ata tgt tgg age aag act att tea gcg gtt ttg get rea get tgt 720 
He He Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 
225 230 235 240 

atg atg get ctg tgt ttc caa cag tgc gga tgg eta tec cat gat ttt 768 
Mtet Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 • 250 255 

etc cac aat cag gtg ttt gag aca cge tgg ctt aat gaa gtt gtc ggg 816 
Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 
260 265 270 

tat gtg ate ggc aac gee- gtt ctg ggg ttt agt aca ggg tgg tgg aag 864 
Tyr Val He Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 
.275 280 285 

gag aag cat aac ctt eat cat get get cca aat gaa tgc gat cag act • 912 
Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 
290 295 300 
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tac caa cca att gat gaa gat att gat act etc ccc etc att gcc tgg 960 
Tyr Gin Pro He Asp Glu Asp He Asp Thr Leu Pro Leu He Ala Trp 
305 310 315 320 

age aag gacata ctg gcc aca gtt gag aat aag aca ttc ttg cga ate- ' 1008 
Ser Lys Asp He Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 
325 330 335 

etc caa tac cag cat ctg ttc ttc atg ggt ctg tta ttt ttc gcc cgt 1056 
Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 350 

ggt agt tgg etc ttt tgg age tgg aga tat ace tet aca gca gtg etc 1104 
Gly Ser Trp Leu Phe Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val .Leu 
355 360 365 

tea cct gtc gac agg ttg ttg gag aag gga act gtt ctg ttt cac tac 1152 
Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370. 375 380 - 

ttt tgg ttc gtc gggaca geg tge tat ctt etc cct ggt tgg aag cca 1200 
Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 
385 390 • 395 ' 400 

tta gta tgg atg geg gtg act gag etc atg tec gge atg ctg ctg ggc 1248 
Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 

405 . : 410 415 

ttt gta ttt gta ctt age cac aat ggg atg gag gtt tat aat teg tet 1296 
Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420* 425 430 

aaa gaa ttc gtg agt gca cag 'ate gta tee aca, egg gat ate aaa gga 1344 
Lys Glu Phe Val Ser .Ala Gin He Val Ser Thr Arg Asp He Lys Gly 

435 ' 440 445 

- •■ . «k • ' 

\ \ ' . ' 

aac ata ttc ewic gac tgg ttc act ggt ggc ctt aac agg caa ata gag 1392 

Asn lie Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Qln He Glu 

450 . LJ'455 460 

cat cat ctt ttc cca aca atg ccc agg cat aat tta aac aaa ata gca • 1440 
His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
465 470'{ t 475 480 

cct aga gtg gag gtg ttc tgt aag aaa cac ggt ctg gtg tac gaa gac 1488 
Pro. Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

gta tet att get ace ggc act tge aag gtt ttg aaa gca ttg aag gaa 1536 
Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
. 500 505 510 

gtc geg gag get geg gca gag- cag cat get ace ace agt taa 1578 
Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
515 520 525 



<210> 8 
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<211> 525 
<212> PRT " 

<2X3> Physcomitrella patens 



<400> 8 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 

.1 5 10 15 

lie Asp Val Glu His He Ala Ser Met Ser Leu Phe Ser Asp Plie Phe 
20 25 30 

Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser He Gin. 
35 -40 '45 

Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
50 ' .55 60 

Val Gin C!ys He Ser Ala Glu Val Gin Arq Asn Ser Ser Thx Gin Gly 
65 70 75 80 

Thr Ala Glu Ala Leu .Ala Glu Ser Val Val Lys Pro Thx Arg Arg Arg 
85 90 95 

Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
100 105 ' . ' 110 

His Asn Lys Pro Ser Asp cys Trp He val Val Lys Asn Lys val Tyr 
115 120 125 

Asp Val Ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser Val He Ser 
130 135 140 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 

145 150 155 . 160 

Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
165 170 175 

Arg val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
180 185 190 

Ala Leu Phe Leu Arg Glu Gin. Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
195 200. 205 

Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 
210 2.15 220 

He He Cys Trp Ser Lys Thr He "Ser Ala Val Leu Ala Ser Ala Cys 
225 230 . • 235 240 



Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 

Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 
260 . 265 270 

Tyr val He Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 
275 280 285 
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Glu Lys His Asn Leu His His Ala Ala Pto Asn Glu Cys Asp Gin Thr 
290 295 300 

Tyr Gin Pro lie Asp Glu Asp lie Asp Thr Leu Pro Leu lie Ala Trp 
305 310 315 320 

' Ser Lys Asp He lieu Ala "Thr Val Glu Asn Lys Tlir Phe Leu Arg He 
325 330 -335 

Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 . 350 

Gly Ser Trp Leu Phe Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu 
355 360 . 365 

Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370 . 375 '380 

Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 
385 390 395 400 

Leu Val Ttp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 

405 410 415 

Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 

Lys Glu Phe Val Ser Ala Glh He Val Ser Thr Arg Asp He Lys Gly 
435 440 445 

Asn He Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin He Glu 
. 450 455 460 

His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
465 470 475 480 

Pro Argr Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
500 505 . 510* 



Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
515 520 525 



<210> 9 
<211> 873 
<212> DNA 

<213> Physcoiuitrella patens 

<220> 

<221> CDS 

<222> (1) . . (873) 

<400> 9 

atg gag gtc gtg gag aga ttc tac ggt gag ttg gat ggg aag gtc teg 
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Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
. 1 5 10 15 

cag ggc gtg aat gca ttg ctg ggt agt ttt ggg gtg gag ttg acg gat 96 
Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu pxr Asp 
20 25 30 

acg ccc act acc aaa ggc ttg ccc etc gtt gac agt ccc aca ccc ate- 144 
Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro lie 
35 40 45 

gtc etc ggt gtt tot gta tac ttg act att gtc att gga ggg ctt ttg 192 
Val Leu Gly Val Ser val Tyr Leu Thr lie Val He Gly Gly Leu Leu 
50 ' 55 60 

tgg at a aag gcc agg gat ctg aaa ccg cgc gcc teg gag cca ttt ttg 240 
Trp He Lys Ala Arg Asp Leu. Lys Pro Arg Ala Ser Glu Pro Phe Leu . 
•65 . 70 " • 75 . 

etc caa get ttg gtg ctt gtg cac aac ctg tt'e tgt ttt gcg etc agt 288 
Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Piie Ala Leu Ser 
85. 90 .95 

ctg tat atg tgc gtg ggc ate get tat cag get att acc tgg egg fcac 336 
Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala He Thr Trp Arg Tyr 
100 105 110 

tct etc tgg ggc aat gca tac aat cct aaa cat aaa gag atg gcg att 384 
ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala He 
115 120 125 

ctg gta tac ttg ttc tac atg tct aag tac gtg gaa ttc atg gat acc 432 
Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 . 135 . .140 

gtt ate atg ata ctg aag cgc age ace agg caa ata age- ttc etc cac 480 
Val He Met He Leu Lys Arg Ser* Thr* Arg Gin He Ser Phe Leu His 
145 150 155 160 

gtt tat cat cat tct tea att tec etc att tgg tgg get att get cat 528 
Val Tyr His His Ser Ser He Ser Leu He Trp Trp Ala He Ala His 
165 * 170 • 175 

cac get cct ggc ggt gaa! gca tat tgg tct gcg get ctg aac tea gga 576 
His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
180 185 190 

gtg cat gtt etc atg tat gcg tat tac ttc ttg get gcc tgc ctt cga 624 
Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
195 200 205 

agt age cca aag tta aaa aat aag tac ctt ttt tgg ggc agg tac ttg 672 
Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
210 215 220 

aca caa ttc caa atg ttc cag. ttt atg ctg aac tta gtg cag get tac 720 
Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 
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tac gac atg aaa acg aat gcg cca tat cca caa tgg ctg ate aag att 768 
Tyx Asp Met Lys Thx Asn Ala Pro Tyr Pro Gin Trp Leu He Lys lie 
245 250 255 

ttg ttc tac tac atg ate teg ttg ctg ttt ctt ttc ggc aat ttt tac 816 
Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 
260 . 265 ■ 270 • 

gta caa aaa tac ate aaa ccc tot gac gga aag caa aag gga get aaa 864 
Val Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 

act gag tga 873 
Thr Glu 
290 



<210>. 10 
<211> 290 
<212> PRT 

<213> Physcomitrella patens 
<400> 10 ' 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 

.1 " 5 ' 10 • 15 ' 

Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20 25 30 

Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro He 
35 ■ 40 45 

Val Leu Gly Val Ser Val Tyr Leu Tlir He Val He Gly Gly Leu Leu 
50 -55 60 

Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe lieu 
65 70 75 80 

Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 
85 90 - • 95 

Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala He Thr Trp Arg Tyr 
100 105 110 

Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala He 
115 120 125 

Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 135 140 

Val He Met He Leu Lys Arg Ser Thr Arg Gin He Ser Phe Leu His 
145 150 155 160 

Val Tyr His His Ser Ser He Ser Leu He Trp Trp Ala He Ala His 

165 • 170 175 



His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
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180 185 190 



Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
195 200 205 . 

Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 

210 ' 215 220 

Thx Gin Phe Gin Met Phe Glh Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 

Tyr Asp Met Lys Thr Asn Ala Pro Ty^^- Gin Trp Leu He Lys He 
245 250 ■ 255 . 

Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr . 
260 265 . 270 

Val .Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285." 



* Thr Glu 
290 



<210> 11 
<211> 1526 
'<212> ISNA 

<i213> Phaeodactylum tricomutum 

<220> 

<221> CDS 

<:222> (92).. (1402) 

<:400> 11 ' ; 

gcttccgtta gcgtcccata gtttgttaca cttggctgtg aaacgaatac gttcttggtc 60 

tacttactac aacgaagcaa ccaccagcag c atg- ggt aag gga ggt caa cga 112 

Met Gly Lys Gly Gly Gin Arg 

1 . 5 

get gta get ccc aag agt gcc acc age tct act ggc agt get acc ctt 160 
Ala Val Ala Pro Lys Ser Ala Thr Ser Ser Thr Gly Ser Ala Thr Leu 
10 15 20 

age caa age aag gaa eag gta tgg act teg teg tac aac cet ctg gcg 208 
Ser Gin Ser Lys Glu Gin Val Trp Thr Ser Ser Tyr Asn Pro Leu Ala 
25 30 35 

aag gat tec ecg gag ctg cca acc aaa ggc caa ate aag gee gtc att 256 
Lys Asp Ser Pro Glu Leu Pro Thr Lys Gly Gin He Lys Ala Val He 
40 45 50 ' . 55 . 

ccg aag gaa tgt ttc caa cgc tea gee ttt tgg tct aec tte tae ctg 304 
Pro Lys Glu Cys Phe Gin Arg Ser Ala Phe Trp Ser Thr Phe Tyr Leu 
60 . 65 70 

atg cgc gat etc gee atg get gee gee ttt tge tac gga ace tea eag 352 
Met Arg Asp Leu Ala Met Ala Ala Ala Phe Cys Tyr Gly Thr Ser Gin 
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75 80 85 

gtc etc tec acc gac ctt ccc caa gac gcc acg etc att ctg ccc tgg 400 
Val Leu Ser Thr Asp Leu Pro Gin Asp Ala Thr Leu He Leu Pro Trp 
90 95 100 

get etc gge tgg ggc gtc tae gcc ttt tgg atg gga acc att etc acc 448 
Ala Leu Gly Trp Gly Val Tyr Ala Phe Trp Met Gly Thr He Leu Thr . 
105 110 115 

ggg cct tgg gta gtt gcg cae gaa tgt gga cac ggc get tac tec gac 496 
Gly Pro Trp Val Val Ala His Glu Cys Gly His Gly Ala Tyr Ser Asp 
120 . 125 130 135. 

tec cag acg ttc aat gac gtg gtc ggc ttt ate gtc cac caa get ttg 544 
Ser Gin Thr Phe Asn Asp Val Val Gly Phe He Val His' Gin Ala Leu 
140 145 150 

etc gtc ccc tac ttt gcc tgg cag tac acc cac gcg aaa cac cac cgt 592 
Leu Val Pro Tyr Phe Ala Trp Gin Tyr Thr His Ala Lys His His Arg 
155 160 165 

cga acc. aac cat ctg gtg gac ggc gag tec cac gtc cct tct acc gcc 640 
Arg Thr Asn His Leu Val Asp Gly Glu Ser His Val Pro Ser Thr Ala 
170 175 180 

' aag. gat aac ggc etc ggg ccg cac aac gag cga aac tec ttc tac gcc 688 
Lirs Asp Asn Gly Leu Gly Pro His Asn Glu Arg Asn Ser Phe Tyr Ala 
185 190 195 

gcg tgg cac gag gcc atg gga gac' ggc gcc ttt gcc gtc ttt caa gtc 736 
Ala Trp His Glu Ala Met Gly Asp Gly Ala Phe Ala Val Phe Gin Val 
200. 205 210 215 * 

tgg teg cac ttg ttc gtc ggc tgg cct etc tac ttg gcc ggt ctg gcc 784 
Trp Ser His Leu Phe Val Gly Trp Pro Leu Tyr Leu Ala Gly Leu Ala 
220 225 230 

agt acc gga aag ctt gcg cae gaa ggt tgg tgg ctg gaa gaa egg aac 832 
Ser Thr Gly Lys Leu Ala His Glu Gly Trp Trp Leu Glu Glu Arg Asn 
235 240 245 

gcg att gcg gat cac ttt cga ccc age tct. ccc atg ttc ccc gcc aag 880 
Ala He Ala Asp His Phe Arg Pro Ser Ser Pro Met Phe Pro Ala Lys 
250 255 260 

ate cgt gcc aag att gcc ctt tec age gcg acg gaa etc gcc gtg etc 928 
He Arg Ala Lys He Ala Leu Ser Ser Ala Thr Glu Leu Ala Val Leu 
265 270 275 

get gga etc ttg tat gtc ggt aca cag gtc gga cac ctt ccc gtc ctg 976 
Ala Gly Leu Leu Tyr Val Gly Thr Gin Val Gly His Leu Pro Val Leu 
280 - ' 285 290 295 

ctg tgg tac tgg gga ccg tac acc ttt gtc aac get tgg ctt gta etc 1024 
Leu Trp Tyr Trp Gly Pro Tyr Thr Phe Val Asn Ala Trp Leu Val Leu 
300 305 310 
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tac acg tgg ctg cag cat acg gac ccg tec ate ccg'cac tac ggt gaa 1072 
Tyr Thr Trp Leu Gin His Thr Asp Pro Ser lie Pro His Tyr Gly Glu 
315 320 325 

ggc gag tgg acc tgg gtc aag ggc gcg etc tot acc att gat cga gac 1120 - 
Gly Glu Trp Thr Trp Val Lys Gly Ala Leu Ser Thr lie Asp Arg Asp 

330 . 335 340 . 

tac ggc ate ttc gat ttc ttt eac cac acc ate ggt tec acg cac gtg 1168 
Tyr Gly He Phe Asp Phe Phe His His Thr He Gly Ser Thr His Val 
345 350 -355 

gta cac cat ttg ttc cac gaa atg ccc tgg tac aat gee ggc att gcc 1216 
Val His His Leu Phe His Glu Met Pro Trp Tyr Asn Ala Gly He Ala 
360 365 370 375 

acg caa aag gtc aag gaa ttt ttg gaa ccc cag ggc ttg tac aat tac 1264 
Thr Gin Lys Val Lys Glu Phe Leu Glu Pro Gin Gly Leu Tyr Asn Tyr 
380. 385 390 

gat ccg acc ccc tgg tac aag gcc atg tgg cgc att gee egg acc tgt 1312 
Asp Pro Thr Pro Trp Tyr Lys Ala Met Trp Arg He Ala Arg Thr Cys 
395 ' . : 400 "405 

cac tat gtg gag tea aac gag ggt gtg cag tat ttc aag agt atg gaa 1360 
His Tyr Val Glu Ser Asn Glu Gly Val Gin Tyr Phe Lys Ser Met Glu 
410 . 415 420 

aac gtg ccg ctg act aag gat gtg cga aac aaa gcc gca tga 1402 
Asn Val Pro Leu Thr Lys Asp Val Arg Asn Lys Ala Ala 
425 43p 435 

gaaaaagtgc caccgacgca taattttaca atcctaccaa caagaccaac attatatggt 1462 

tttcgcttaa aagatagttt tttctaccat ctgtgtagtc ggcacaaaaa aaaaaaeiaaa 1522 

aaaa 1526 



<210> 12 

<211> 43.6 

<212> PRT . 

<213> Phaeodactyluia tricomutum 

<400> 12 

Met Gly Lys Gly Gly Gin Arg Ala Val Ala Pro Lys Ser Ala Thr Ser 
1 5 10 15 . 

Ser Thr Gly Ser Ala Thr Leu Ser Gin Ser Lys Glu Gin Val Trp Thr 
20 * 25 • 30 

Ser Ser Tyr Asn Pro Leu Ala Lys Asp Ser Pro Glu Leu Pro Thr Lys . 
35 : 40 45 

Gly Gin He Lys Ala Val lie Pro Lys Glu Cys Phe Gin Arg Ser Ala 
'50 55 60 

Phe Trp Ser Thr Phe Tyr Leu Met Arg Asp Leu Ala Met Ala Ala Ala 
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65 70 75 80 

Phe Cys Tyr Gly Thr Ser Gin Val Leu Ser Thr Asp Leu Pro Gin Asp 
.85 90 93 

Ala Thr Leu lie Leu pro Trp Ala Leu Gly Trp Gly val Tyr Ala Phe 
100 105 110 

Trp Met Gly Thr lie Leu. Thr Gly Pro Trp Val Val Ala His Glu Cys 
115 120 125 

Gly His Gly Ala Tyr Ser Asp Ser Gin Thr Phe Asn Asp Val Val Gly 
'130 135 140 

Phe lie Val His Gin Ala Leu Leu Val Pro Tyr Phe Ala Trp Gin Tyr 
145 150 155 160. 

Thr His Ala Lys His His Arg Arg Thr Asn His Leu Val Asp Gly Glu 

■ 155 170 175 

Ser His Val Pro Ser Thr Ala Lys Asp Asn Gly Leu Gly Pro His Asn 
180 '185 190 

Glu Arg Asn Ser Phe Tyr Ala Ala Trp His Glu Ala Met Gly Asp Gly 
195 200 .205 

Ala ipihe Ala Val Phe Gin Val Trp Ser His Leu Phe Val Gly Trp Pro 
210 215 ' ■ • 220 ■ * 

Leu Tyr Leu Ala Gly Leu Ala Ser Thr . Gly Lys Leu Ala His Glu Gly 
225 230 235 240 

Trp Trp Leu Glu Glu Arg Asn Ala lie. Ala Asp His Phe Arg Pro Ser 
245 . 250 255 

Ser Pro Met Phe Pro Ala Lys He Arg Ala Lys He Ala Leu Ser Ser 
260 265 270 

Ala Thr Glu Leu Ala Val Leu Ala Gly Leu Leu Tyr Val Gly Thr Gin 
275 280 285 

Val Gly His Leu Pro- Val Leu Leu. Trp Tyr Trp Gly Pro Tyr Thr Phe 
290 295 j" . 300 

Val Asn Ala Trp Leu Val Leu Tyr Thr Trp Leu Gin His Thr Asp Pro 
305 310 315 320 

Ser He Pro His Tyr Gly Glu Gly Glu Trp Thr Trp Val Lys Gly Ala 
325 330 335 

Leu Ser Thr He Asp Arg Asp Tyr Gly lie Phe Asp Phe Phe His His 
. 340 345' 350 

Thr He Gly Ser Thr His Val Val His His Leu Phe His Glu Met Pro 
355 360 365 

Trp Tyr Asn Ala Gly He Ala Thr Gin Lys Val Lys Glu Phe Leu Glu- 
370 375 380 
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Pro Gin Gly Leu Tyr Asn Tyr Asp Pro Thr Pro Tip Tyr Lys Ala Met 
385 390 395 400 

Trp Arg He Ala Arg Olir Cys His Tyr Val Glu Ser Asn Glu Gly Val 
405 410 415 

Gin Tyr Phe Lys Ser Met Glu Asn val Pro Leu Thr Lys Asp val Arg 
420 425 430 

Asn Lys Ala Ala 
435 



'<210> 13 
<211> 3598 
<212> DNA 
<213> unJcnown 

<220> 

<223> Seqiaenz stellt eine pflanzliche 

Promotor-Terminator-E3cpressionskassette in Vektor 
pUC19 dar 



<400> 13 

tcgcgcgttt. cggtgatgac 


ggtgaaaacc 


tctgacacat 


gcagctcccg 


gagacggtca 


60 


cagcttgtct 


gtaagcggat 


gccgggagca 


gacaagcccg 


tcagggcgcg 


tcagcgggtg 


120 


ttggcgggtg 


tcggggctgg 


cttaactatg 


cggcatcaga 


gcagattgta 


ctgagagtgc 


180 


accatatgcg 


gtgtgaaata 


ccgcacagat 


gcgtaaggag 


aaaataccgc 


atcaggcgcc 


240 


attcgccatt 


caggctgcgc 


aactgttggg 


aagggcgatc 


ggtgcgggcc 


tcttcgctat 


300 


tacgccagct 


ggcgaaaggg 


ggatgtgctg 


caaggcgatt 


aagttgggta 


acgccagggt 


360 


tttcccagtc 


acgacgttgt 


aaaacgacgg 


ccagtgaatt 


cggcgcgccg 


agctcctcga 


420 


gcaaatttac 


acattgccac 


taaacgtcta 


aacccttgta 


atttgttttt 


gttttactat 

s \ 


480 


gtgtgttatg 


tatttgattt 


gcgataaatt 


tttatatttg 


gtactaaatt 


tataacacct 


540 


tttatgctaa 


cgtttgccaa 


cacttagcaa 


tttgcaagtt 


gattaattga 


ttctaaatta 


600 


tttttgtctt 


ctaaatacat 


atactaatca 


actggaaatg 


taaatatttg 


ctaatatttc 


660 


tactatagga 


gaattaaagt 


gagtgaatat 


ggtaccacaa 


ggtttggaga 


tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa 


acattcaata 


attcttgagg 


ataataatgg 


780 


taccacacaa 


gatttgaggt 


gcatgaacgt 


cacgtggaca 


aaaggtttag 


taatttttca 


840 


agacaacaat 


gttaccacac 


acaagttttg 


aggtgcatgc 


atggatgccc 


tgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaccatg 


acatccactt 


960 


ggaggatgca 


ataatgaaga 


aaactacaaa 


tttacatgca 


actagttatg 


catgtagtct 


1020 
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atataatgag 


gattttgcaa 


cacLbCcauti 


cacacacacu 


cacuaaguuc 






taacuucCuc 


atagccagcc 


caccgcggtg 


ggcggccgcc 


4" rr/** A ^ 4" f" a rr 

ugcag LC ucig 


cciy U 


1140 


gctctaatga 


gatatgcgag 


acgcctatga 


ucgcaugaua 




a t- 1* r« rr fr* rrl- 




gcacgttgta 


aaaaacctga 


gcatgtgtag 


c^cagaticct 


caccgccggu 


^ ^ ^ f ^ ^ n a ^ 

u uc ggt u w a u 


1 0 fin 


tctaatgaat 


atatcacccg 


ttactatcgt 


atttttatga 


ataatattcu 


ccguucaacr 


1 ion 


tactgattgt 


ccgtcgacga 


attcgagctc 


ggcgcgccaa 


gcttggcgta 


atcatggtca 


i ion 


tagctgtttc 


ctgtgtgaaa 


ttgttacccg 


ctcacaattc 


cacacaacac 


acgagc c y ga 


XtfctiU 


agcataaagt 


gtaaagcctg 


gggtgcctaa 


tgagtgagct 


aaclicacalzt 


aat t gcgt tg 


XDUU 


cgctcactgc 


ccgctttcca 


gtcgggaaac 


ctgtcgtgcc 


age ^gcaC t a 


augaaccggc 




caacgcgcgg 


ggagaggcgg 


tttgcgtatt 


gggcgctctt 


ccgcttcctc 


go u cac ugac 


1 son 


tcgctgcgct 


cggtcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


ggcggtaa ta 


1 f on 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


aggccagcaa 


1 '7/1 
X /4U 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


ccgcccccct 


XoUU 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaac c c gac 


aggactabaa 


XooU 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc- 


gaccctgccg 


X^lzU 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttc 


tcatagctca 


i o on 


cgctgtaggt 


atctcagttc 


ggtgtaggtc 


gttcgctcca 


agctgggctg 


tgtgcacgaa 




ccccccgttc 


agcccgaccg 


ctgcgcctta 


tccggtaact 


atcgtctitiga 


g tc c aacc eg 


ZXUU 


gtaagacacg 


.acttatcgcc 


actggcagca 


gccactggta 


acaggattag 


cagagcgagg 


zXoU 


tatgtaggcg 


gbgctacaga 


gl:tcttgaag 


tggtggccta 


ac^acggcta 


cac t agaagg 




acagtatttg 


gtatctgcgc 


tctgctgaag 


ccagttacct 


tcggaaaaag 


agttggtagc 




tcttgatccg 


gcaaacaaac 


caccgctggt 


sgcggtggtt 




c aagcagc ag 




attacgcgca 


gaaaaaaagg 


atctca^aa 


gatcctttga 


tcucccccac 


gSQ^Q^ to tgac 


0 /I n n 


gctcagtgga 


acgaaaactc 


acgttaaggg 


auccuggcca 


cgagacuanc 


A Si a a *^<"ra ^ «^ 

aao-aaggcl cc 


Z40U 


ttcacctaga 


tccttttaiaa 


ttaaaaatga 


agttttaaat 


caatctaaag 


batata tgag 


2520 


taaacttggt 


ctgacagtta 


ccaatgctta 


atcagtgagg 


cacctatctc 


agcgatctgt 


2580 


ctatttcgtt 


catccatagt 


tgcctgactc 


cccgtcgtgt 


agataactac 


gatacgggag 


2640 


ggcttaccat 


ctggccccag 


tgctgcaatg 


ataccgcgag 


acccacgctc 


accggctcca 


2700 


gatttatcag 


caataaacca 


gccagccgga 


agggccgagc 


gcagaagtgg 


tcctgcaact 


2760 



26 



ttatccgcct 


ccatccagtc 


tattaattgt 


tgccgggaag 


ctagagtaag 


tagttcgcca 




gttaatagtt 


tgcgcaacgt 


tgttgccatt 


gctacaggca 


tcgtggtgtc 


acgctcgtcg 


o o on 


tttggtatgg 


cttcattcag 


ctccggttcc 


caacgatcaa 


ggcgagttac 


atigatccccc 




atgttgtgca 


aaaaagcggt 


tagctccttc 


ggtcctccga 


tcgttgtcag 


aagtaagttg 


•3 A r\ A 


gccgcagtgt 


tatcactcat 


ggttatggca 


gcactgcata 


acccuctuac 


tgtcatgcca 




tccgtaagat 


gcttttctgt 


gactggtgag 


tactcaacca 


agtcattctg 


agaatagtgt 


■a •! 0 A 


atgcggcgac 


cgagttgctc 


ttgcccggcg 


tcaatacggg 


ataataccgc. 


.gccacatagc 


3180 


agaactttaa 


aagtgctcat 


cattggaaaa 


cgttcttcgg 


ggcgaaaact 


ctcaaggatc 


3240 


ttaccgctgt 


tgagatccag 


ttcgatgtaa 


"cccactcgtg 


cacccaactg 


atcttcagca 


3300 


tcttttactt 


tcacca^cgt 


ttctgggtga 


gcaaaaacag 


gaaggcaaaa 


tgccgcaaaa 


3360 


aagggaataa 


gggcgacacg 


gaaatgttga 


atactcatac 


tcttcctttt 


tcaatattat 


3420 


tgaagcattt 


atcagggtta 


ttgtctcatg 


agcggataca 


tatttgaatg 


tatttagaaa 


3480 


aataaacaaa 


taggggttcc 


gcgcacattt 


ccccgaaaag 


tgccacctga 


cgtctaagaa 


3540 


accattatta 


tcatgacatt 


aacctataaa 


aataggcgta 


tcacgaggcc 


ctttcgtc 


3598 



<210> 14 
<211> 3590 
<212> DNA 
■<213> Unloiown 

<220> 

<223> Sequenz stellt eixxe pflanzl'iche 

Promotor-Terminator-Expreesionskassette in Vektor . 
PUC19 dar 

<400> 14 

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cggcgcgccg agctcctcga 420 
gcaaatttac acattgccac taaacgtcta aacccttgta atttgttttt gttttactat 480 
gtgtgttatg tatttgattt gcgataaatt tttatatttg gtactaaatt tataacacct 540 



27 



tttatgctaa 


cgtttgccaa cacttagcaa 


tttgcaagtt 


gattaattga 


tuccaaatta 


bUU 


tttttgtctt 


ctaaatacat 


atactaatca 


actggaaatg 


taaatatttg 


^^^^^^^ 
ctaatatttc 




tactatagga 


gaattaaagt gagtgaatat 


ggtaccacaa 


ggtttggaga 


tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa 


acattcaata 


attcttgagg 


ataataatgg 


780 


taccacacaa 


gatttgaggt 'gcatgaacgt 


cacgtggaca 


aaaggtttag 


taatttttca 


840 


agacaacaat 


gc uaccacac 


a C o. ayTl u u L. g 


aggtgcatgc 


atggatgccc 


tgtggaaagt 


900 . 


ttaaaaatat 


c u u ggaaa ug 


aucugcaugg 


aagccatgtg 


taaaaccatg 


acatccactt 


960 


ggaggatgca 


auaa^gaaga 


acLaCuaCciacl 


tttacatgca 


actagttatg 


catgtagtct 


1020 


atataatgag 


gacc u ugcaa 


4> A /-I {- f> 4- A 4- 4- 

cac u u ucau u 


catacacact 


cactaagttt 


tacacgatta 


1080 


taatttcttc 


acagccagc g 


ga u c c ga ua t 


cgggcccgct 


agcgttaacc 


ctgctttaat 


1140 


gagatatgcg 


agac gc c tia t 


gac cgca uga 


tatttgcttt 


caattctgtt 


gtgcacgttg 


1200 


taaaaaacct 


gage ai«g ug u 


age uc agate 


cttaccgccg 


gtttcggttc 


attctaatga 


1260 


atatatcacc 


cgucaccauc 


guaccucuau 


gaataatatt 


ctccgttcaa 


tttactgatt 


1320 


gtccgtcgac 


gaac ucgagc 


u cggcgcgc c 


aagcttggcg 


taatcatggt 


catagctgtt 


1380 


tcctgtgtga 


aaccgucacc 


cgcEcacaac 


tccacacaac 


atacgagccg 


gaagcataaa 


1440 


gtgtaaagcc 


^ggg y ^gcc c 


aacgagngag 


ctaactcaca 


ttaattgcgt 


tgcgctcact 


1500 


gcccgctttc 


cagccgggad 




ccagctgcat 


taatgaatcg 


gccaacgcgc 


1560 


ggggagaggc 


y^guu uy wy ua 


t uyyycyw 


ttccgcttcc 


tcgctcactg 


actcgctgcg 


1620 


ctcggtcgtt 


^ yy ^ uy cyy 


y ciy w y y ud u v« 


agctcacbca 


aaggcggtaa 


tacggttatc 


1680 


cacagaatca 


ggggataacg 


caggaaagaa 


catgtgagca 


aaaggccagc 


aaaaggccag 


1740 


gaaccgtaaa 


aaggccgcgt 


tgctggcgtt 


tttccatagg 


ctccgccccc 


ctgacgagca 


1800 


tcacaaaaat 


cgacgctcaa 


gtcagaggtg 


gcgaaacccg 


acaggactat 


aaagatacca 


1860 


ggcgtttccc 


cctggaagct 


ccctcgtgcg 


ctctcctgtt 


ccgaccctgc 


cgcttaccgg 


1920 


atacctgtcc 


gcctttctcc 


cttcgggaag 


cgtggcgctt 


tctcatagct 


cacgctgtag 


1980 


gtatctcagt 


tcggtgtagg 


tcgttcgctc 


caagctgggc 


tgtgtgcacg 


aaccccccgt 


2040 


tcagcccgac 


cgctgcgcct 


tatccggtaa 


ctatcgtctt 


gagtccaacc 


cggtaagaca 


2100 


cgacttatcg 


ccactggcag 


cagccactgg 


taacaggatt 


agcagagcga 


ggtatgtagg 


2160 


cggtgctaca 


gagttcttga 


agtggtggcc 


taactacggc 


tacactagaa 


ggacagtatt 


2220 


tggtatctgc 


gctctgctga 


agccagttac 


cttcggaaeia 


agagttggta 


gctcttgatc 


2280 
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cggcaaacaa 


accaccgctg 


gtagcggtgg 


tttttttgtt 


tgcaagcagc agattacgcg 


2340 


cagaaaaaaa 


ggatctcaag 


aagatccttt 


gatcttttct 


acggggtctg acgctcagtg 


2400 


gaacgaaaac 


tcacgttaag 


ggattttggt 


catgagatta 


tcaaaaagga tcttcaccta 


2460 


gatcctttta 


aattaaaaat 


gaagttttaa 


atcaatctaa 


agtatatatg agtaaacttg 


2520 


gtctgacagt 


taccaa.t:gct 


taatcagtga 


ggcacctatc 


tcagcgatct gtctatttcg 


2580 


ttcatccata 


gttgcctgac 


tccccgtcgt 


gtagataact 


acgatacggg agggcttacc 


2640 


atctggcccc 


agtgctgcaa 


tgataccgcg 


agacccacgc 


tcaccggctc cagatttatc 


2700 


agcaataaac 


cagccagccg 


gaagggccga 


gcgcagaagt 


ggtcctgcaa ctttatccgc 


2760 


ctccatccag 


tctattaatt 


gttgccggga 


agctagagta 


agtagttcgc cagttaatag 


2820 


tttgcgcaac 


gttgttgcca 


ttgctacagg 


catcgtggtg 


tcacgctcgt cgtttggtat 


2880 


ggcttcattc 


agctccggtt 


cccaacgatc 


aaggcgagtt 


acatgatccc ccatgttgtg 


2940 


caaaaaagcg 


gttagctcct 


tcggtcctcc 


gafccgttgtc 


agaagtaagt tggccgcagt 


3000 


gttatcactc 


atggttatgg 


cagcactgca 


taattctctt 


actgtcatgc catccgtaag 


3060 


atgcttttct 


gtgactggtg 


agtactcaac 


caagtcattc 


tgagaatagt gtatgcggcg 


3120 


accgagttgc 


tcttgcccgg 


cgtcaatacg 


ggataatacc 


gcgccacata gcagaacttt 


3180 


aaaagtgctc 


atcattggaa 


aacgttcttc 


ggggcgaaaa 


cbctcaagga tcttaccgct 


3240 


gttgagatcc 


agttcgatgt 


aacccactcg 


tgcacccaac 


tgatcttcag catcttttac 


3300 


t'ttcaccacrc 


att tic taacrli 


cradc aaaaac 


acrcraaocTcaa 


aatcrccorcaa aaaacracraat 


3360 


i^cigggcgaca 


cggaaatgtt 


gaatactcat 


actcttcctt 


tttcaatatt attgaagcat 


3420 


ttatcagggt 


tattgtctca 


tgagcggata 


catatttgaa 


tgtatttaga aaaataaaca 


3480 


aataggggtt 


Gcgcgcacat 


ttccccgaaa 


agtgccacct 


gacgtctaag aaaccattat 


3540 


tatcatgaca 


ttaacctata 


aaaataggcg 


tatcacgagg 


ccctttcgtc 


3590 


<210> 15 
<211> 3584 








■" * ~ " J 





<212> DNA 
<213> UnJaiown 



<220> 

<223> Sequenz stellt eine pflanzliche 

Promotor-Terminator-Expressionskaseette in Vektor 
pUC19 dar" 



<400> 15 

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 



29 



cagcttgtct 


gtaagcggat 


gccgggagca gacaagcccg 


tcagggcgcg 


tcagcgggtg 


120 


ttggcgggtg 


tcggggctgg 


cttaactatg cggcatcaga 


gcagattgta 


ctgagagtgc 


180 


accatatgcg 


gtgtgaaata 


ccgcacagat gcgtaaggag 


aaaataccgc 


atcaggcgcc 


240 


attcgccatt 


caggctgcgc 


aactgttggg aagggcgatc 


ggtgcgggcc 


tcttcgctat 


300 


tacgccagct 


ggcgaaaggg 


ggatgtgctg caaggcgatt 


aagttgggta 


acgccagggt 


360 


tttcccagtc 


acgacgttgt 


aaaacgacgg ccagtgaatt 


cggcgcgccg 


agctcctcga 


420 


gcaaatttac 


acattgccac 


taaacgtcta aacccttgta 


atttgttttt 


gttttactat 


480 


gtgtgttatg 


tatttgattt 


gcgataaatt tttatatttg 


gtactaaatt 


tataacacct 


540 


tttatgctaa 


cgtttgccaa 


cacttagcaa tttgcaagtt 


gattaattga 


ttctaaatta 


600 


tttttgtctt 


ctaaatacat 


atactaatca actggaaatg 


taaatatttg 


cfcaatatttc 


660 


tactatagga 


gaattaaagt 


gagtgaatat ggtaccacaa 


ggtttggaga 


tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa acattcaata 


attcttgagg 


ataataatgg 


780 


taccacacaa 


gatttgaggt 


gcatgaacgt cacgtgg^ca. 


aaaggtttag 


taatttttca 


840 


agacaacaat 


gttaccacac 


acaagttttg aggtgcatgc 


atggatgccc 


tgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg aagccatgtg 


taaaaccatg 


acatccactt 


960 


ggaggatgca 


ataatgaaga 


aaactacaaa tttacatgca 


actagttatg 


catgtagtct 


1020 


atataatgag 


gattttgcaa 


tactttcatt catacacact 


cjactaagttt 


tacacgatta 


1080 


taatttcttc 


atagccagca 


gatctgccgg catcgatccc 


gggccatggc 


ctgctttaat 


1140 


gagatatgcg 


agacgcctat • 


gatcgcatga tatttgcttt 


caattctgtt 


gtgcacgttg 


1200 


taaaaaacct 


gagcatgtgt 


agctcagatc cttaccgccg 


gtttcggttc 


attctaatga 


1260 


atatatcacc 


cgttactatc 


gtatttttat gaataatatt 


ctccgttcaa 


tttactgatt 


1320 


gtccgtcgac 


gagctcggcg 


cgccaagctt ggcgtaatca 


tggtcatagc 


tgtbtcctgt 


1380 


gtgaaattgt 


tatccgctca 


caattccaca caacatacga 


gccggaagca 


taaagtgtaa 


1440 


agcctggggt 


gcdtaatgag 


tgagctaact cacattaatt 


gcgttgcgct 


cactgcccgc 


1500 


tttccagtcg 


ggaaacctgt 


cgtgccagct gcattaatga 


atcggccaac 


gcgcggggag 


1560 


aggcggtttg 


cgtattgggc 


gctcttccgc ttcctcgctc 


actgactcgc 


tgcgctcggt 


1620 


cgttcggctg 


cggcgagcgg 


tatcagctca ctcaaaggcg 


gtaatacggt 


tatccacaga 


1680 


atcaggggat 


aacgcaggaa 


agaacatgtg agcaaaaggc 


cagcaaaagg 


ccaggaaccg 


1740 


taaaaaggcc 


gcgttgctgg 


cgtttttcca taggctccgc 


ccccctgacg 


agcatcacaa 


1800 
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aaatcgacgc 


tcaagtcaga 


ggtggcgaaa 


cc c gacagga 


c cacaaagac 


accaggcguu 


XOOU 


tccccctgga 


agctccctcg 


tgcgctctcc 


tgttccgacc 


ctgccgctta 


ccggatacct 




gtccgccttt 


ctcccttcgg 


gaagcgtggc 


gccttcccac 


agc^cacgct 


gcaggxaccu 




cagttcggtg 


taggtcgttc 


gctccaagct 


gggctgtgtg 


cacgaacccc 


ccglz'tcagcc 




cgaccgctgc 


gccttatccg 


gtaactatcg 


tcttgagtcc 


aacccggtaa 


gacacgactt 




atcgccactg 


gcagcagcca 


ctggtaacag 


gattagcaga 


gcgaggtatg 


taggcggtgc 




tacagagttc 


ttgaagtggt 


ggcctaacta 


cggctacact 


agaaggacag 


s 

tactcggcac 


o o o rt 


ctgcgctctg 


ctgaagccag 


ttaccttcgg 


aaaaagagtt 


ggtagctctt 


gatccggcaa 


O O O A 


acaaaccacc; 


gctggtagcg 


gtggtttttt 


tgtttgcaag 


cagcagatta 


cgcgcagaaa 




aaaaggatct 


caagaagatc 


ctttgatctt 


ttctacgggg 


tctgacgctc 


agtggaacga 


2400 


aaactcacgt 


taagggattt 


tggtcatgag 


attatcaaaa 


aggatcttca 


cctagatcct 


2460 


tttaaattaa 


aaatgaagtt 


ttaaatcaat 


ctaaagtata 


tatgagtaaa 


cttggtctga 


2520 


cagttaccaa 


tgcttaatca 


gtgaggcacc 


tatctcagcg 


atctgtctat 


ttcgttcatc 


2580 


catagttgcc 


tgactccccg 


tcgtgtagat 


aactacgata 


cgggagggct 


taccatctgg 


2640 


ccccagtgct 


gcaatgatac 


cgcgagaccc 


acgctcaccg 


gctccagatt 


tatcagcaat 


2700 


aaaccagcca 


gccggaaggg 


ccgagcgcag 


aagtggtcct 


gcaactttat 


ccgcctccat 


2760 


ccagtctatt 


aattgttgcc 


gggaagctag 


agtaagtagt 


tcgccagtta 


atagtttgcg 


O O O A 

2ozU 


caacgttgtt 


gccattgcta 


caggcatcgt 


ggtgtcacgc 


tcgtcgcttg 


gtatggcttc 


2oo0 


attcagctcG 


ggttcccaac 


gatcaaggcg 


agttacatga 


tcccccatgt 


tgtgcaaaaa 




agcggttagc 


tccttcggtc 


ctccgatcgt 


tgtcagaagt 


aagttggccg 


cagtgttatc 


3000 


actcatggtt 


atggcagcac 


tgcataattc 


tcttactgtc 


atgccatccg 


taagatgctt 


A C A 

30o0 


ttctgtgact 


ggtgagtact 


caaccaagtc 


attctgagaa 


tagtgtatgc 


ggcgaccgag 


D i OA 

3120 


ttgctcttgc 


ccggcgtcaa 


tacgggataa 


taccgcgcca 


catagcagaa 


c uc taaaagx 


3180 


gctcatcatt 


ggaaaacgtt 


cttcggggcg 


aaaactictca 


aggat c t ^ac 


CQ'c tgt t gag 


^ '5 V! A 

324U 


atccagttcg 


atgtaaccca 


ctcgtgcacc 


caactgatct 


tcagcatctt 


ttactttcac 


3300 


cagcgtttct 


gggtgagcaa 


aaacaggaag 


gcaaaatgcc 


gcaaaaaagg 


gaiataagggc 


3360 


gacacggaaa 


tgttgaatac 


tcatactctt 


cctttttcaa 


tattattgaa 


gcatttatca 


3*420 


gggttattgt 


ctcatgagcg 


gatacatatt 


tgaatgtatt 


tagaaaaata 


aacaaatagg 


3480 


ggttccgcgc 


acatttcccc 


gaaaagtgcc 


acctgacgtc 


taagaaacca 


ttattatcat 


3540 



31 



gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtc 

<210> 16 
<211> 4507 
<212> DNA 
<213> Unknown 

<220> 

<223> Sequenz stellt eine pflanzliche 

Promotor-Terminator-Expressionskassette in Vektor 
PUC19 dar 



<400> 16 
tcgcgcgttt 


cggtgatgac 


ggtgaaaacc 


tctgacacat 


gcagctcccg gagacggtca 


60 


cagcttgtct 


gtaagcggat 


gccgggagca 


gacaagcccg 


tcagggcgcg tcagcgggtg 


120 


ttggcgggtg 


tcggggctgg 


cttaactatg 


cggcatcaga 


gcagattgta ctgagagtgc 


180 


accatatgcg 


gtgtgaaata 


ccgcacagat 


gcgtaaggag 


aaaataccgc atcaggcgcc 


240 


attcgccatt 


caggctgcgc 


aactgttggg 


aagggcgatc 


ggtgcgggcc tcttcgctat 


300 


tacgccagct 


ggcgaaaggg 


ggatgtgctg 


caaggcgatt 


aagttgggka acgccagggt 


360 


tttcccagtc 


acgacgttgt 


aaaacgacgg 


ccagtgaatt 


cggcgcgccg agctcctcga 


420 


gcaaatttac 


acattgccac 


taaacgtcta 


aacccttgta 


atttgttttt gtfcttactat 


480 


gtgtgttatg 


tatttgattt 


gcgataaatt 


tttatatttg 


gtactaaatt tataacacct 


540 


tttatgctaa 


cgtttgccaa 


cacttagcaa 


tttgcaagtt 


gattaattga ttctaaatta 


600 


Ul« 


r" a a a i" f* a t 


n i*Gi>« »aCfcC» wv^c* 


ac ttcrcraa.at cr 


taaatatiibcr c'taata'bttic 


660 


tactatagga 


gaattaaagt 


gagtgaatat 


ggtaccacaa 


ggtttggaga tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa 


acattcaata 


attcttgagg ataataatgg 


780 


taccacacaa 


gatttgaggt 


gcatgaacgt 


cacgtggaca 


aaaggtttag taatttttca 


840 


agacaacaat 


gttaccacac 


acaagttttg 


aggtgcatgc 


atggatgccc tgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaccatg acatccactt 


960 


ggaggatgca 


ataatgaaga 


aaactacaaa 


tttacatgca 


actagttatg catgtagtct 


1020 


atata^tgag 


gattttgcaa 


tactttcatt 


catacacact 


cactaagttt tacacgatta 


1080 


taatttcttc 


atagccagcc 


caccgcggtg 


ggcggccgcc 


tgcagtctag aaggcctcct 


1140 


gctttaatga 


gatatgcgag 


acgcctatga 


tcgcatgata 


tttgctttca attctgttgt 


1200 


gcacgttgta 


aaaaacctga 


gcatgtgtag 


ctcagatcct 


taccgccggt t t egg t teat 


1260 


tctaatgaat 


atatcacccg 


ttactatcgt 


atttttatga 


ataatattct ccgttcaatt 


1320 



32 



tactgattgt 


ccgtcgagca 


aatttacaca 


ttgccactaa 


acgn c uaaac 


C c V. l.g u clcl u u 


1 7ftn 


tgtttttgtt 


ttactatgtg 


tgttatgtac 


ttgatttgcg 


auaaacuuuu 






ctaaatttat 


aacacctttt 


atgctaacgt 


Cugccaacac 


uuagcaacuc 


rr^a a/r^ t*^a 4* 

gwcisigu ugei u 




taatt^attc 


taaattattt 


ttgtcttcta 


aatacatata 


ccaaucaacc 


ggaaaugcaa 


1 RAO 


atatttgcta 


atatttctac 


tataggagaa 


ttaaagtgag 


cgaacauggc 


accacaagg^ 


1 i^on 


ttggagattt 


aattgttgca 


atgctgcatg 


gatggcatat 


acacc aaaca 




XO OU 


cttgaggata 


ataatggtac 


cacacaagat 


ttgaggtgca 


cgaacgucac 




X / fiU 


ggtttagtaa 


tttttcaaga 


caacaatgtt 


accacacaca 


agbt^ttgagg 


cgc acgcacg 


XoUU 


gatgccctgt 


ggaaagttta 


aaaatatccc 


ggaaacgacc 


Lgcauggaag 


M /vt" a a 

- ccacgcguaa 


xsou 


aaccatgaca 


tccacttgga 


ggatgcaata 


atgaagaaaa 


ccacaaacwC 


acacgcaacu 




agttatgcat 


gtagtctata 


taatgaggat 


tttgcaacac 


tzuucacccac 


acacac t cac 


1 QQA 


taagttttac 


acgattataa 


tttcttcata 


gccagcggat 


ccgatatcgg 


gcccgc tagc 


o n /! n 


gttaaccctg 


ctttaatgag 


atatgcgaga 


cgcctatgat 


cgcatgatat 


cugctt ucaa 


210U 


ttctgttgtg 


cacgttgtaa 


aaaacctgag 


catgtgtagc 


tcagatcctt 


accgccggttz 




tcggttcatt 


ctaatgaata 


tatcacccgb 


tactatcgta 


ttutcatgaa 


caatacuctc 




cgttcaattt 


actgattgtc 


cgtcgacgaa 


ttcgagctcg 


gcgcgccaag 


c c cggc gxaa 




tcatggtcat 


agctgtttcc 


tgtgtgaaat 


tgtuacccgc 


ticacaattcc 


acacaacaca 




cgagccggaa 


gcacaaagtg 


taaagcctgg 


ggtgcctaat 


gagtigagc ba 


acccacacca 




attgcgttgc 


gctcactgcc 


cgctt:l:ccag 


ccgggaaacc 


ugucgcgcca ■ 


f^fi^Am Mr/if ^ ih 4* a a 
gC ugCcLUCaOi 




tgaatcggcc 


aacgcgcggg 


gagaggcggt 


ttgcgtattg 


ggcgc uccuc 


cgccucctcg 




ctcactgact 


cgctgcgctc 


ggtcgttcgg 


ctgcggcgag 


cggtatoagc 


c cac ucaaag 




gcggtaatac 


ggttatccac 


agaatcaggg 


gataacgcag 


gaaagaacat 


gugagcaaaa 




ggccagcaaa 


aggccaggaa 


ccgtaaaaag 


gccgcgttgc 


cggcgcuucc 


ccacaggccc 




cgcccccctg 


acgagcatca 


caaaaatcga 


cgc tic aagt c 


agagg cggcg 






ggactataaa 


gataccaggc 


gtttccccct 


ggaagctccc 


tcgtgcgctc 


tcctgttccg 


2820 


accctgccgc 


ttaccggata 


cctgtccgcc 


tttctccctt 


cgggaagcgt 


ggcgctttct 


2880 


catagctcac 


gctgtaggta 


tctcagttcg 


gtgtaggtcg 


ttcgctccaa 


gctgggctgt 


2940 


gtgcacgaac 


cccccgttca 


gcccgaccgc 


tgcgccttat 


ccggtaacta 


tcgtcttgag 


3000 


tccaacccgg 


taagacacga 


cttatcgcca 


ctggcagcag 


ccactggtaia 


caggattagc 


3060 
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agagcgaggt 


atgtaggcgg 


tgctacagag 


actagaagga 


cagtatttgg 


tatctgcgct 


gttggtagct 


cttgatccgg 


caaacaaacc 


aagcagcaga 


ttacgcgcag 


aaaaaaagga 


gggtctgacg 


ctcagtggaa 


cgaaaactca 


aaaaggatct 


tcacctagat 


ccttttaaat 


atatatgagt 


aaacttggfcc 


tgacagttac 


gcgatctgtc 


tatttcgttc 


atccatagtt 


atacgggagg 


gcttaccatc 


tggccccagt 


ccggctccag 


atttatcagc 


aataaaccag 


cctgcaactt 


tatccgcctc 


catccagtct 


agttcgccag 


ttaatagttt 


gcgcaacgtt 


cgctcgtcgt 


ttggtatggc 


ttcattcagc 


tgatccccca 


^gttigtgcaa 


aaaagcggtt 


agtaagttgg 


ccgcagtgtt 


atcactcatg 


gtcatgccat 


ccgtaagatg 


cttttctgtg 


gaatagtgta 


tgcggcgacc 


gagttgctct 


ccacatagca 


gaactttaaa 


agtgctcatc 


tcaaggatct 


taccgctgtt 


gagatccagt 


tcttcagcat 


cttttacttt 


caccagccftt 


gccgcaaaaa 


agggaataag 


ggcgacacgg 


caatattatt 


gaagcattta 


tcagggttat 


atttagaaaa 


ataascaaat 


aggggttccg 


gtctaagaaa 


ccattattat 


catgacatta 



tttcgtc . 



<210> 17 
■<211> 5410 
<212> DNA 
<213> Unknown 



ttcttgaagt 


9'gtggcctaa 


c uacggcc ac 




ctgctgaagc 


cagt^tacctt 


cggaaaaaga 


1 Rfl 
J J.O u 


accgctggta 


gcggtggttt 


Cut ugcucgc 




tcccaagaag 


accccucgac 


M 4* 4« ^ ^ j^^w 

ccr utCuacg 


11 Art 


cgttaaggga 


ctucggccac 


gagattatca 


1 1 ff 


taaaaatgaa 


gttttaaatc 


aatctaaagt 


1 >f O A 


caatgcttaa 


tcagtgaggc 


acctatctca 




gcctgactcc 


ccgtcgtgta 


gataactacg 




gctgcaatga 


taccgcgaga 


cccacgctca 


*> f n A 

3600 


ccagccggaa 


gggccgagcg 


cagaagtggt 


3do0 


.attaattgtt 


gccgggaagc 


tagagtaagt 


3720 


gttgccattg 


ctacaggcat 


cgtggtgtca 


3780 


tccggttccc 


aacgatcaag 


gcgagttaca 


3840 


agctccttcg 


gtcctccgat 


cgttgtcaga 


3900 


gttatggcag 


cactgcataa 


ttctcttact 


•a rt 

39o0 


actggtgagt 


actcaaccaa 


gtcattctga 


4020 


tgcccggcgt 


caatacggga 


taataccgcg 


4080 


attggaaaac 


gttcttcggg 


gcgaaaactc 


4140 


tcgatgtaac 


ccactcgtgc 


acccaactga 


4200 


tctgggtgag 


caaaaacagg 


aaggcaaaat 


4260 


aaatgttgaa 


tactcatact 


cttccttttt 


4320 


tgtctcatga 


gcggatacat 


atttgaatgt 


4380 


cgcacatttc 


cccgaaaagt 


gccacctgac 


4440 


acctataaaa 


ataggcgtat 


cacgaggccc 


4500 
4507 



<220> 



34 

<223> Seqnenz stellt eine pflanzliche 

Promotor-Teanninator-Expressionskassette in Vektor 
PUC19 dar 



<400> 17 
ttttggaaat 


gatttgcatg 


gfiw.gccatgt 


gtaeiaaccat 


gacatccact 


tggaggatgc 


60 


aataatgaag 


aaaactacaa 


afcttacatgc 


aactagttat 


gcatgtagtc 


tatataatga 


120 


ggattttgca 


atactttcat 


tcatacacac 


tcactaagtt 


ttacacgatt 


ataatttctt 


180 


catagccagc 


ggatccgata 


tcgggcccgc 


tagcgttaac 


cctgctttaa 


tgagatatgc 


240 


gagacgccta 


tgatcgcatg 


atatttgctt 


tcaattctgt 


tgtgcacgtt 


gtaaaaaacc 


300 


tgagcatgtg 


tagctcagat 


ccttaccgcc 


ggtttcggtt 


cattctaatg 


aatatatcac 


360 


ccgttactat 


cgtattttta 


tgaataatab 


tctccgttca 


atttactgat 


tgtccgtcga 


420 


gcaaatttac 


acattgccac 


taaacgtcta 


aacccttgta 


atttgttttt' 


gttttactat 


.480 


gtgtgttatg 


tatttgattt 


gcgataaatt 


tttatatttg 


gtactaaatt 


tataacacct 


540 


tttatgctaa 


cgtttgccaa 


cacttagcaa 


tttgcaagtt 


gattaattga 


ttctaaatta 


600 


tttttgtctt 


ctaaatacat 


atactaatca 


actggaaatg 


taaatatttg 


ctaatatttc 


660 


tactatagga 


gaattaaagt 


gagtgdatat' 


ggtaccacaa 


ggtttggaga 


tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa 


acattcaata 


attcttgagg 


ataataatgg 


780 . 


taccacacaa 


gatttgaggt gcatgaacgt 


cacgtggaca 


aaaggtttag 


fcaatttttca 


840 


agacaacaat 


gttaccacac 


acaagttttg 


aggtgcatgc 


atggatgccc 


tgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaccatg 


acatccactt 


960 


ggaggatgca 


ataatgaaga aaactacaaa 


tttacatgca 


actagttatg 


catgtagtct 


1020 


atataatgag 


gattttgcaa tactttcatt 


catacacact 


cactaagttt 


bacacgatta 


1080 


taatttcttc 


atagccagca gatctgccgg 


catcgatccc 


gggccatggc 


ctgctttaat 


1140 


gagatatgcg 


agacgcctat 


gatcgcatga 


tatttgcttt 


caattctgtt 


gtgcacgttg 


1200 


taaaaaacct 


gagcatgtgt 


agctcagatc 


cttaccgccg 


gtttcggttc 


attctaatga- 


1260 


atatatcacc 


cgttactatc 


gtatttttat 


gaataatatt 


ctccgttcaa 


tttactgatt 


1320 


gtccgtcgac 


gagctcggcg 


cgccaagctt 


ggcgtaatca 


tggtcatagc 


tgtttcctgt 


1380 


gtgaaattgt 


tatccgctca caattccaca 


caacatacga 


gccggaagca 


taaagtgtaa 


1440 


agcctggggt 


gcctaatgag 


tgagctaact 


cacattaatt 


gcgttgcgct 


cactgcccgc 


1500 


tttccagtcg 


ggaaacctgt 


cgtgccagct 


gcattaatga 


atcggccaac 


gcgcggggag 


1560 


aggcggtttg 


cgtattgggc 


gctcttccgc 


ttcctcgctc 


actgactcgc 


tgcgctcggt 


1620 
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cgttcggctcf 


cggcgagcgg 


uauCagcuCa euCcLaaggcg 


rri* 9 9 s ^(Wfiwf4» 

guaouacggu 


uaL*i«\«civ»My a 


1680 








/-I art r"" a a a arrrr 
wcLcicLcLy y 


PCS cf craacccr 

i^*^&y y »^^^y 


1740 




gcgu cgc^gg 


cguuuu&cwd ucLggwuwQ>gw 




ay w a u v# GL%« cLGi 


1800 


9 A 9 4* M M 9 ^ 0>tft 


ccaagc caga 


sg^s^Caaaa cecgacagga 


O 9 t* 9*9 9 ^9 ^ 


ciwCay y^y u u 


1860 


4** 0m ^ ^^^v^ 

CCCCCCbyycl 


age c cc c u eg 


cgcgeeecee uguucegace 


ccgeegecba 


ecgga ucLco u 


1 Q5n 


gtccgccttt 


^ ^ 4(B ^if 

cccccuucgg 


gaagcguggc gcuu^cccac 


age c Cacgc u 


rtl" a/WT+"a 

y uagy ua UC t 




cagttcggtg 


taggtcgttc 


ge^ccaagcu gggci^gcgcg 


cacgaaeccc 


c c y L. L. Cay c c 




cgsLc cgc^gc 


gcc c ca uc eg 


JM i» n <M M fa M fa M fa ^ fa fa yaa M V M 

guaaeuaceg ucuugaguce 


9 9 ^*^^yi^r >■ 9 9 

aaceegguaa 


gaC acy cic u u 


91 on 


atcgccactg 


gcagcagc ca 


cisggtaaeag gattagcaga 


gcgaggtatg 


uaggcggcge 




tacagagttc 


ttgasigtggt 


ggcctaaeta eggcbacaet 


agaaggae ag 


^ 9 ^ 4* 4* /v^v4> 9 4- 

cacucggcac 




ctgcgctctg 


ctgaagccag 


ttaccttcgg aaaaagagtt 


ggtagctctt 


gatccggcaa 


O O Q A 


acaaaccacc 


gctggtagcg 


_ . 1- _-irj- j-l- Ir ti 1- t— t- fa fa fa^-V;n>-> 

gcgguttttc cgtcugcaag 


cagcagatta 


cgcgcagaaa 




aaaaggatct 


caagaagate 


etttgatctt ttctacgggg 


tctgacgetc 


ag t ggaac ga 




aaactcacgt 


taagggatuc 


t^ggt^ca^gag atlia'tcaaaa 


aggaccucea 


cecagacccu 




Cucaaauraa 


aaa ugaagc c 


fa fa «^ M ^ fa ^ ^ ^ fa ^ fa «;> 9 9 J'i" 1 ■ 9 9 

ccaaaceaac ccaaaguaca 


fa fa Min »<ffa 9 9 9 

ca ugagc aaa 


^ fa fa> mmmmtm m fa m>9 

Cucggtcuga 




cagttaccaa 


tgct^taatea 


gcgaggeacc catcucagcg 


9 ^ J*fa?.^|M Mfa M fa 

a uc ug uc c ac 


^ 4* j» ji> III 1^ M s 4b M 

Cuegxccacc 


6 con 


catagttgcc 


tgactccccg 


tcgtgt^agat aactacgata 


c gggag gg c t 


taccatctgg 


o yi n 


ccccagtgct 


gcaa t ga t ac 


cgcgagaccc acgctcaccg 


gccccagacc 


t^atcagcaat 


0»7 Art 

z /UU 


aaaccagcca 


gccggaaggg 


cegagcgcag aagtggtcct 


gcaacuucaw 


ccgectecaL 


Z /OU 


ccagtctatic 


aati Hg t ^gc c 


_nj_rij rn m ^m^* 4v ^^4* A 9^*V4* 9 ^v4* 

gggaagccag agcaa^cagu 


ccgccagcca 


a w age c cgc g 




caacgc eg u c 


gccaccgcca 


caggcatcgc ggcgccacgc 


ucgccgcucg 


gc acgge u c c 


O Q Q A 


alitcagctcc 


ggli ce caac 


gaucaaggcg agcuacacga 


^^#^^^^9 4" /*»fa 

ccccccdcgc 


ugxge aaa aa 


O OA A 


agcgg 1 1 age 


^ce t ticggtie 


ecccgaucgc uyucayaagu 


aagucggccg 


a rv4- 4~ a ^ 

cagcy ucacc 


J uuu 


ac ucacggt. c 


acggcagcac 


fa /-w'j— 1 afassfaVr^ 4~r^4*l"a V* /tI ' ^ 

cgcacaacicc tcucaccgcc 


acgcc.ai.ccy 


t^a a^Ta4*/Tr^^ ^ 

uaoya 1. y c u u 


^ AAA 


ttctgtgact 


ggtgagtact 


caaccaagte attctgagaa 


tagtgtatgc 


ggcgaccgag 


3120 


ttgctcttgc 


ecggcgtcaa 


tacgggataa taccgcgcea 


catagcagaa 


ctttaaaagt 


3180 


gctcatcatt 


ggaaaacgtt 


cttcggggcg aaaactetca 


aggatcttac 


cgctgttgag 


3240 


atccagttcg 


atgtaaecca 


ctcgtgcacc caactgatct 


tcagcatctt 


ttactttcac 


3300 


cagcgtttct 


gggtgagcaa 


aaacaggaag gcaaaatgcc 


gcaaaaaagg 


gaataagggc 


3360 
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gacacggaaa 


tgttgaatac 


tcatactctt 


cctttttcaa 


tattattgaa 


- ■ ^ ^ X- ^ mm, A* A . 

gcatttatca 


3420 


gggttattgt 


ctcatgagcg 


gatacatatt 


tgaatgtatt 


tagaaaaata 


aacaaatagg 


3480 


ggttccgcgc 


acatttcccc 


gaaaagrtgcc acctgacgtc 


taagaaacca 


t tat ta teat 


3540 


gacattaacc 


tataaaaata 


ggcgtatcac gaggcccttt 


cgtctcgcgc 


gtttcggtga 


3600 


tgacggtgaa 


aacctctgac 


acatgcagct 


cccggagacg 


gtcacagctt 


gtctgtaagc 


3660 


ggatgccggg 


agcagacaag 


cccgtcaggg cgcgtcagcg 


ggtgttggcg 


Vgtgtcgggg' 


'3720 


ctggcttaac 


tatgcggcat 


cagagcagat tgbactgaga 


gtgcaccata 


tgcggtgtga 


3780 


aataccgcac 


agatgcgtaa 


ggagaaaata ccgcatcagg 


cgccattcgc 


cattcaggct 


3840 


gcgcaactgt 


tgggaagggC 


gatcggtgcg ggcctcttcg 


ctattacgcc 


agctggcgaa 


•3900 


agggggatgt 


gctgcaaggc 






gggttttccc 


agtcacgacg 


3960 


ttgtaaaacg 


acggccagtg 


aac ccggcgc 


gccgagcucc 


tcgagcaaat 


ttacacattg 


4020 


ccactaaacg 


tctaaaccct 




uuc uy^ u t.u ua 


ctatgtgtgt 


tatgtatttg 


4080 


atttgcgata 


aatttttata 


f* ^ ^ /VfTT^ a ^ 1~ A 


AAt'^f'A^AA^ 


accttttatg 


ctaacgtttg 


4140 


ccaacactta 


gcawLtttgca 


n f*rr» 4" ^ A A 

CLy t. CI U XmtXtX 


L. a.v> Uw l«C&Cl 


attatttttg 


tcttctaaat 


4200 


acatatacta 


atcaactgga 


A A f*rTl~ A A A t" A 


+• h nr^ t" A A "h A 


tttctactat 


aggagaatta 


4260 


aagtgagtga 


atatggtacc 


acaaggtttg 


gagatttaat 


tgttgcaatg 


ctgcatggat 


4320 


ggcatataca 


ccaaacattc 


aataattctt 


gaggataata 


atggtaccac 


acaagatttg 


4380 


aggtgcatga 


acgt.cacgtg 


gacaaaaggt 


ttagtaafctt 


ttcaagacaa 


caatgttacc 


4440 


acacacaagt 


tttgaggtgc 


atgcatggat 


gccctgtgga 


aagtttaaaa 


atattttgga- 


4500 


aatgatttgc 


atggaagcca 


tgtgtaaaac 


catgacatcc 


acttggagga 


tgcaataatg 


4560 


aagaaaacta 


caaatttaca 


tgcaactagt 


tatgcatgta 


gtctatataa 


tgaggatttt 


4620 


gcaatacttt 


cattcataca 


cactcactaa 


gttttacacg 


attataattt 


cttcatagcc 


4680 


agcccaccgc 


ggtgggcggc 


cgcctgcagt 


ctagaaggcc 


tcctgcttta 


atgagatatg 


4740 


cgagacgcct 


atgatcgcat 


gatatttgct 


ttcaattctg 


ttgtgcacgt 


tgtaaaciaac 


4800 


ctgagcatgt 


gtagctcaga 


tccttaccgc 


cggtttcggt 


tcabtctaat 


gaatatatca 


4860 


cccgtbacta 


tcgtattttt 


atgaataat'a 


ttctccgttc 


aatttactga 


ttgtccgtcg 


4920 


agcaaattta 


cacattgcca 


ctaaacgtct 


aaacccttgt • 


aatttgtttt 


tgttttacta 


4980 


tgtgtgttat 


gtatttgatt 


tgcgataaat 


ttttatattt 


ggtactaaat 


ttataacacc 


5040 


ttttatgcta 


acgtttgcca 


acacttagca 


atttgcaagt 


tgattaattg 


attctaaatt 


5100 
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atttttgtct tctaaataca tatactaatc aactggaaat gtaaatattt gctaatattt 5160 
ctactatagg agaattaaag tgagtgaata tggtaccaca aggtttggag atttaattgt 5220 
tgcaatgctg catggatggc atatacacca aacattcaat aattcttgag gataataatg 5280 
gtaccacaca agatttgagg tgcatgaacg tcacgtggac aaaaggttta gtaatttttc 5340 
aagacaacaa tgttaccaca cacaagtttt gaggtgcatg catggatgcc ctgtggaaag 5400 
tttaaaaata 5410 



<210> 18 
<211> 648 
<212> DNA 

<213> Phaeodactylum tricornutum 

<220> 
<221> CDS- 
<222> (I).. (648) 

<220> 
<223> 

<400> 18 

tgg tgg aaa aac aag, cac aac gga cac cac gcc gtc ccc aac etc cac 48 
Trp Trp Lys Asn Lys His Asn Gly His His Ala val pro Asn Leu His 
1 ■ 5 10 15 

tgc tec tec gca gtc gcg caa gat ggg gac ccg gac ate gat ace atg 96 
Cys Ser Ser Ala Val "Ala Gin Asp Gly Asp Pro Asp lie Asp Thr Met . 
* 20 25 30 

ccc ctt etc gcc tgg tec gtc cag caa gcc cag tct tac egg gaa etc 144 
Pro Leu Leu Ala Trp. Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu 
X 35 40 45 

caa gcc gac gga aag gat teg ggt ttg gtc aag ttc atg ate egt aac 192 
Gin Ala Asp Gly Lys Asp Ser Gly Leu val Lys Plie Met lie Arg Asn 
50 55 60 

caa tec tac ttt tac ttt ccc ate ttg ttg etc gcc cgc ctg teg tgg 240 
Gin Ser Tyr Phe Tyr Phe Pro He Leu Leu Leu Ala Arg Leu Ser Trp 
65 '70 * 75 80 

ttg aac gag tec ttc aag tgc gcc ttt ggg ctt gga get gcg teg gag 288 
Leu Asn Glu Ser Phe Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu 
85 90 95 

aac get get etc gaa etc aag gcc aag ggt ctt cag tac ccc ctt ttg 336 
Asn Ala Ala Leu Glu Leu I^ys Ala Lys Gly Leu Gin Tyr Pro Leu Leu 
100 105 110 

gaa aag get ggc ate ctg ctg cac tac get tgg atg ctt aca gtt teg 384 
Glu Lys Ala Gly He Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser 
115 120 125 
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tec ggc ttt gga cgc ttc teg ttc gcg tac acc gca ttt tac ttt eta 432 
Sex Gly Phe Gly Arg Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu 
130 135 140 

acc gcg acc gcg tec tgt gga ttc tfcg etc gee att gtc ttt ggc etc 480 
Thr Ala Thr Ala Ser Cys Gly Phe Leu Leu Ala lie Val Phe Gly Leu 
145 150 155 160 

ggc cac aac ggc atg gcc acc tac aat gcc gae gcc cgt ccg gac ttc 528 
Gly His Asn Gly Met Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe 
165 . .170 175 

tgg aag etc caa gtc acc acg act cgc aac gtc acg ggc gga cac ggt 576 
Trp Lys Leu Gin Val Thr Thr Thr Arg Asn Val Thr Gly Gly His Gly 
180 185 190 

ttc ccc caa gcc ttt gtc gac tgg ttc tgt ggt ggc etc cag tac caa 624 
Phe Pro Gin Ala Phe Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr. Gin* 
195 200 205 . 

gtc gac cac cac tta ttc ccc age 648 
Val Asp His His Leu Phe Pro Ser 
210 215 



<210> 19 

<2ii> 216 . 

<212> PRT - - ■ 

<213> Phaeodactylum tricomutum 

<400> 19 

Trp Trp Lys Asn Lys His Asn Gly His His Ala Val Pro Asn Leu His 
1 5 10 . . 15 

Cys Ser Ser Ala Val Ala Gin Asp Gly Asp Pro Asp lie Asp Tftir Met 
20 25 30 

Pro Leu Leu Ala Trp Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu 
35 "40 45 

Gin Ala Asp Gly Lys Asp Ser Gly Leu Val Lys Phe Met lie Arg Asn 
50 55 • . 60 . 

Gin Ser Tyr Phe Tyz Phe Pro lie Leu Leu Leu Ala Arg Leu Ser Trp 
65 70 ' . 75 80 

Leu Asn Glu Ser Phe Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu 

85 90 95 ; 

Asn Ala Ala Leu Glu Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu 
100 105 110 

Glu Lys Ala Gly He Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser 
115 120 125 

Ser Gly Phe Gly Arg Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu 
130 135 140 
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Thr Ala Thr Ala Ser Cys Gly Phe Leu Leu Ala lie Val Phe Gly Leu 
145 150 155 . 160 

Gly His Asn Gly Met Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe 
165 . 170 175 

Trp Lys Leu Gin Val Thr Thr Thr Arg Asn Val Thr Gly Gly His Gly 
180 . 185 190 

Phe Pro Gin Ala Phe Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin 

195 200 205 

Val Asp His His Leu Phe Pro Ser 
210 215 



'<210> 20 
•<211> 12093 
<212> DNA 
<213> pnknown 

<220> 

<223> pflaazlicher Expressionsvektor mit einer 
Promotor-Terxoinator-Expressionskassette 

<400> 20 



gatctggcgc 


cggccagcga 


gacgagcaag 


attggccgcc 


gcccgaaacg 


atccgacagc 


60 


gcgcccagca 


caggtgcgca 


ggcaaattgc 


accaacgcat 


acagcgccag 


cagaatgcca 


120 


tagtgggcgg 


tgacgtcgtt 


cgagtgaacc 


agatcgcgca 


ggaggcccgg 


cagcaccggc 


180 


ataatcaggc 


cgatgccgac 


agcgtcgagc 


gcgacagtgc 


tcagaattac 


gatcaggggt 


240 


atgttgggtt 


tcacgtctgg 


cctccggacc 


agcctccgct 


ggtccgattg 


aacgcgcgga 


300 


ttctttatca 


Gtgataagtt 


ggtggacata 


ttatgtttat 


cagtgataaa 


gtgtcaagca 


360 


tgacaaagtt 


gcagccgaat 


acagtgatcc 


gtgccgccct 


ggacctgttg 


aacgaggtcg 


420 


gcgtagacgg 


tctgax:gaca 


cgcaaactgg 


cggaacggtt 


gggggttcag 


cagccggcgc 


480 


tttactggca 


cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa 


gccatgctgg 


540 


cggagaatca 


tacgcattcg 


gtgccgagag 


ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg 


cagcttcagg 


caggcgctgc 


tcgcctaccg 


cgatggcgcg 


cgcatccatg 


660 


ccggcacgcg 


accgggcgca 


ccgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


720 


gcgaggcggg 


tttttcggcc 


ggggacgccg 


tcaatgcgct 


gatgacaatc 


age tact tea 


780 


ctgttggggc 


cgtgcttgag 


gagcaggccg 


•gcgacagcga 


tgccggcgag 


cgcggcggca 


840 


ccgttgaaca 


ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


ttcgacgaag 


900 


ccggtccgga 


cgcagcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


ttggcgaaaa 


960 
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ggaggctcgt 


tgtcaggaac 


gttgaaggac 


cgagaaaggg 


ugacgau uga 


u ocLgga\« ^ gc 


1 n^o 


tgccggagcg 


caacccaclic 


ac t, ac agcag 


agccatgtag 


acaac ax- ccc 




1 oRn 
xu o u 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggctt:t 


4* A» ^ 4>* i*^^^ Z^^^^* 

Cucaugcccc 


gcccuagcgu 




ccaagcctca 


cggccgcgct 


cggcctctct 


??cggccttc 


tggcgcccuc 


ccgcucccuc 


1 o n n 


gctcactgac 


tcgctgcgct 


cggtcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1 c 


ggcggtaaita 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1 o rt 


aggccagcaa 


aaggccagga 
gacgagcatc 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


ccgcccccct 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1 c n n 
1500 


gaccctgccg 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


cggcgcuunc 


1 e f n 


ccgctgcata 


accctgcttc 


ggggtcatta 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


tcgcacgata 


tacaggattt 


tgccaaaggg 


•ttcgtgtaga 


ctttccttgg 


tgtatccaac 


i o /\ 

IboO 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


acgggaatcc 


tgctctgcga 


ggctggccg^ 


1 O 1^ A 

loOO 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 


agggcagccc 


acctatcaag 


gtgtactgcc 


ttccagacga 


acgaagagcg 


attgaggaaa 


19,20 

J* .: 1 


aggcggcggc 


ggccggcatg 


agcctgtcgg 


cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


aaatcacggg 


cgtcgtggac 


tatgagcacg 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


tgggccgcct 


gggcggcctg 


ctgaaactct 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


tcggtgatgc 


cacgatcctc 


gccctgctgg 


cgaagatcga 


agagaagcag 


gacgagettg 


2160 


gcaaggtcat 


gatgggcgtg 


gtccgcccga 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


aacggccggg 


gggtgcgcgt 


gattgccaag 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


1 ^ A 

2340 


gacgctcacc 


gggctggttg 


ccctcgccgc 


tgggctggcg 


gccgtctatg 


g cc ctigcaaa 


2400 


cgcgccagaa 


acgccgtcga 


agccgtgtgc gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


cctcgcggaa 


aacttggccc 


tcactgacag atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


cgactcaccc 


ggcgcggcgt 


tgacagatga ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gatgtggaca 


agcctgggga 


taagtgccct gcggtattga 


cacttgaggg 


gcgcgactac 


2700 
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tgacagatga 


ggggcgcgat 


ccttgacact 


tgaggggcag 


agtgctgaca 


gatgaggggc 


men 


gcacctattg 


acatttgagg 


ggctgtccac 


aggcagaaaa 


tccagcattt 


gcaagggttt 


ZoZD 


ccgcccgttt 


ttcggccacc 


gctaacctgt 


cttttaacct 


gcttttaaac 


caatacttat 


O O Q A 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


29%Q 


tgccccccct 


tctcgaaccc 


tcccggcccg 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


tgcgcccctc 


ggccgcgaac 


ggcctcaccc 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


ttgccgggat 


cggggcagta 


acgggatggg 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


ttgacgtgcc 


gcaggtgctg 


gcatcgacat 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


gcggcctggg 


tggcggcctg 


cccttcactt 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


cggggccggc 


aatttttacc 


ttgggcattc 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


tgttcggggg 


tgcgataaac 


ccagcgaacc 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


gtatgaaaac 


gagaatfcgga 


cctttacaga 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ctaccaagac 


gaagaggatg 


aagaggatga 


ggaggcagatt 


tgccttgaat 


atattgacaa 


3480 


tactgataag 


ataatatatc 


ttttatatag 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


ggcaaggcat 


.aggcagcgcg 


cttatcaata 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


tgcatggact 


aatgcttgaa 


acccaggaca 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


tattgatagt 


gtfcttatgtt 


cagataatgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


acagcgactt 


ccgtcccagc 


cgtgccaggt 


3780 


gctgcctcag 


attcaggtta 


tgccgctcaa 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttcc 


cttcaggcgg 


gattcataca 


gcggccagcc 


atccgtcatc 


cat at caeca 


3900 


cgtcaaaggg 


tgacagcagg 


ctcataagac 


gccccagcgt 


cgccatagtg 


cgttcaccga 


3960 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


gcgatttagc 


cccgacatag 


ccccactgtt 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


tgcccggctg 


tatgcgcgag 


gttaccgact 


gcggcctgag 


ttttttaagt 


gacgtaaaat 


4140 


cgtgttgagg 


ccaacgccca 


taatgcgggc 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 


catatcaatg 


attttctggt 


gcgtaccggg 


ttgagaagcg 


gtgtaagtga 


actgcagttg 


4260 


ccatgtttta 


cggcagtgag 


agcagagata 


gcgctgatgt 


ccggcggtgc 


ttttgccgtt 


4320 


acgcaccacc 


ccgtcagtag 


ctgaacagga 


gggacagctg 


atagacacag 


aagccactgg 


4380 


agcacctcaa 


aaacaccatc 


atacactaaa 


tcagtaagtt 


ggcagcatca 


cccataattg 


4440 
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tggtttcaaa 


atcggctccg 


tcgatactat 


gttatacgcc 


aactttgaaa 


acaactttga 


4500 


aaaagctgtt 


ttctggtatt 


taaggtttta 


gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 


cttgttateia 


ttagcttctt 


ggggtatctt 


taaatactgt 


agaaaagagg 


aaggaaataa 


4620 


taaatggcta 


aaatgagaat 


atcaccggaa 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4680 


gtaaaagata 


cggaaggaat 


gtctcctgct 


aaggtatata 


agctggtggg 


agaaaatgaa 


4740 


aacctatatt 


taaaaatgac 


ggacagccgg 


tataaaggga 


ccacctatga 


tgtggaacgg 


4800 


gaaaaggaca 


tgatgctatg 


gctggaagga 


aagctgcctg 


ttccaaaggt 


cctgcacttt 


4860 


gaacggcatg 


atggctggag 


caatctgctc 


atgagtgagg 


ccgatggcgt 


cctttgctcg 


4920 


gaagagtatg 


aagatgaaca 


aagccctgaa 


aagattatcg 


agctgtatgc 


ffsagtgcatc 


4980 


aggctctttc 


actccatcga 


catatcggat 


tgtccctata 


cgaatagctt 


agacagccgc 


5040 


ttagccgaat 


tggattactt 


actgaataac 


gatctggccg- 


atgtggattg 


cgaaaactgg 


5100 


gaagaagaca 


ctccatttaa 


agate cgcgc 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


cccgaagagg 


aacttgtctt 


ttcccacggc 


gacctgggag 


acagcaacat 


ctttgtgaaa. 


5220 


gatggcaaag 


taagtggctt 


tattgatctt 


gggagaagcg 


gcagggcgga 


caagtggtat 


5280 


gacattgcct 


tctgcgtccg. 


gtcgatcagg 


gaggatatcg 


gggaagaaca 


gtatgtcgag 


5340 


ctattttttg 


acttactggg 


gatcaagcct 


gattgggaga 


aaataaaata 


ttatatttta 


5400 


ctggatgaat 


tgttttagta 


cctagatgtg 


gcgcaacgat 


gccggcgaca 


agcaggagcg 


5460 


caccgacttc 


ttccgcatca 


agtgttttgg 


ctctcaggcc 


gaggcccacg 


gcaagtattt . 


.5520 


gggcaagggg 


tcgctggtat 


tcgtgcaggg 


caagattcgg 


aataccaagt 


acgagaagga 


5580 


cggccagacg 


gtctacggga 


ccgacttcat 


tgccgataag 


gtggattatc 


tggacaccaa 


5640 


ggcaccaggc 


gggtcaaatc 


aggaataagg 


gcacattgcc 


ccggcgtgag 


tcggggcaat 


5700 


cccgcaagga 


gggtgaatga 


atcggacgtt 


tgaccggaag 


gcatacaggc 


aagaactgat 


5760 


cgacgcgggg 


ttttccgccg 


aggatgccga 


aiaccatcgca 


agccgcaccg 


tcatgcgtgc 


5820 


gccccgcgaa 


accttccagt 


ccgtcggctc 


gatggtccag 


caagctacgg 


ccaagatcga 


5880 


gcgcgacagc 


gtgcaactgg 


ctccccctgc 


cctgcccgcg 


ccatcggccg 


ccgtggagcg 


5940 


ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


tttggcgaag 


tcgatgacca 


tcgacacgcg* 


6000 


aggaactatg 


acgaccaaga" 


agcgaaaaac 


' cgccggcgag 


gacctggcaa 


aacaggtcag 


6060 


cgaggccciag 


caggccgcgt 


tgctgaaaca 


cacgaagcag 


cagatcaagg 


aaatgcagct 


6120 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 


6180 



ccgctctgcc ctgttcacca cgcgcaacaa 
ggtcattttc cacgtcaaca aggacgtgaa 
cgacgatgac gaactggtgt ggcagcaggt 
cgagccgatc accttcacgt tctacgagct 
ccggtattac acgaaggccg aggaatgcct 
cacgtccgac cgcgttgggc acctggaatc 
ggaccgtggc aagaaaacgf cccgttgcca 
gtttgctggc gaccactaca cgaaattcat 
ggcccgacgg atgttcgact atttcagctc 
aaccttccgc ctcatgtgcg gatcggattc 
cggcgaagcc tgcgaagagt tgcgaggcag 
tgacctggtg cattgcaaac gctagggcct 
agccagcgct ttactggcat ttcaggaaca 
tcagtatcgc tcgggacgca cggcgcgctc 
ttgacaattg- tgattaaggc tcagattcga 
cgcgagatcc gattgtcggc cctgaagaaa 
cacgaggaga aaaagcccat ggaggcgttc 
ggcgcctaca tcgacggcga gatcattggg 
aaggacgctc acaaggcgca tctgtccggc 
ggggtcgccg gtatgctgct gcgggcgttg 
cgacagattc caacgggaat ctggtggatg 
tcgctattct ggagcttgtt gtttatttcg 
acggtaggcg ctgtgcagcc gctgatggtc 
ccgatacgat tgatggcggt cctgggggct 
Srtgttgacac caaacgcagc gctagatcct 
gtttccatgg cgttcggaac cgtgctgacc 
acctttaccg cctggcaact ggcggccgga 
tttgatccgc caatcccgat gcctacagga 
ctgatcggag cgggtttaac ctacttcctt 



aaa.aa.fc e c ccr 


c crcciacTcrccrc 

^ y V^y My y wy w 


tgcaaaacaa 


6240 


cratcacf^tac 

y c w «^ w <^ w 


33 r" ccf crc cr t ccr 


agctgcgggc 


6300 


CT 1 1 onacrfc ac 




cccctatcgg 


6360 


1 1 crcc acToac 

Wy WSi» ^9 9 


c t CTorcrc t crcr t 


cgatcaatgg 6420 


rrir* fTT'rrr' ^ a 


uciy y ^y ckwy y 


cgatgggctt 


6480 


CTfrtcrtcCTctcf 
yy wy w'-^y d.* i-y 


i" crca n c crc fc 

w vy ^vL^ ^^y Vi' w 


tccgcgtcct 


6540 


yy i.^kd> ^y a l.^ 


y ^^y wy y cao-c*. 


tcgtcgtgct 


^6600 


ci i*y y y cirty 


fc apc7crr*aacrc 

is v» ckc«y w 


tgtcgccgac 


6660 




w^y wGfcwk«i>«y ^ 


.tcaagctgga 


6720 


wcLwv^^ywy uy 


a acraacr fc Cfcrc 

CLCiy CLCiy ^y y ^ 


gcgagcaggt 


6780 


(^y^y uy y 


rra a p a rrrp p t" 
y dciv^cL^y itf 


gggtcaatga 


6840 


^rr^ rrrrrf rr ^ r< a 

Uy tyyyy uu^ 


y u uuoyy ^ uy 


ggggttcagc 


6900 


ay cyy y ca.c u 


y u ut—y cLU y u CL 


cttgcttcgc 


6960 


ueiuycici^ uy u 


p rra a a a pa (T 
wy ci ucicien^ciy 


aggattaaaa 


7020 


cy y u u uy y ay 


wyy ^i^yciuy u 


gcaggatttc 


7080 


y w u ciy ciy ci 


i«y i« L<Voy y y 


cgtttacgag 


7140 


ycuy dauyy u 


iTTPrr^ rr;^ t~rrp 
L.y Lrfy aya. uy 


cgtggcattc 


7200. 


uy uuyy i«v^ u 


W W CkCLCLC*CLy y CL 


ggacggcccc 


7260 


y L.L. iai«v>y uy y 


a rrp c prra A p a 
ay Ut^^y faci^ cl 


gcgaggccga 


7320 


r'fnrrr'mnmi' i~ 
^^yy wyy y v.i» 


tat tore t cert 


gatgatcgtc 


7380 


ccfc at G t tea 


tec t ccTcrccrc 


acttaatatt 




rf fc p fc P offtf p 


uy v«v«y yy v«y y 


ggtcgcggcg 


7500 


<Thcrfct"r'at"pt 

y wy w w M 


c tcrcccf C t C fc 


gctaggtagc 


7560 


a t fc fc crf*crcfaa 


w uy ^yyy v*y u 


ggcgctgttg 


7620 


gtcggcgtcg 


cagcgggcct 


ggcgggggcg 


7680 


cgcaagtggc 


aacctcccgt 


gcctctgctc 


7740 


ggacttctgc 


tcgttccagt 


agctttagtg 


7800 


accaatgttc 


tcggcctggc 


gtggc'tcggc 


7860 


tggttccggg 


ggatctcgcg actcgaacct 


7920 



acagttgttt ccttactggg ctttctcagc 
catcaggccg acagtcggaa cttcgggtcc 
aggggagttg atatcgtcaa cgttcacttc 
cggctttatc cagcgatttc ctattatgtc 
cggttaagcg agaaatgaat aagaaggctg 
tttgatcaca ggcagcaacg ctctgtcatc 
tcatccgtgt ttcaaacccg gcagcttagt 
gagcaaagtc tgccgcctta caacggctct 
gcctgtatcg agtggtgatt ttgtgccgag 
tggcaggata tat'tgtggtg taaacaaatt 
gacgttttta atgtactggg gtggtttttc 
tgcccttcac cgcctggccc tgagagagtt 
gcaggcgaaa atcctgtttg atggtggttc 
agaatagccc gagatagggt. tgagtgttgt 
gaacgtggac tccaacgtca aagggcgaaa 
tgaaccatca cccaaatcaa gttttttggg 
ccctaa'aggg agcccccga*t ttagagcttg 
ggaagggaag aaagcgaaag gagcgggcgc 
gatcggtgcg . ggcctcttcg ctattacgcc 
gattaagttg ggtaacgcca gggttttccc 
aattaattcc. catcttgaaa gaaatatagt 
ggtattatag tccaagcaaa aacataaatt 
tcaataactg attatatcag ctggtacatt 
tgrtgtaatac ataaattgat gatatagcta 
agcttgggtc ccgctcagaa gaactcgtca 
tcgggagcgg cgataccgta aagcacgagg 
tcagcaatat cacgggtagc caacgctatg 
ccacagtcga tgaatccaga aaagcggcca 
tcgccatggg tcacgacgag atcctcgccg 
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cccagatctg gggtcgatca gccggggatg 7980 
ccgacctgta ccattcggtg agcaatggat 8040 
taaagaaata gcgccactca gcttcctcag 8100 
ggcatagttc tcaagatcga cagcctgtca 8160 
ataattcgga tctctgcgag ggagatgata 8220 
gttacaatca acatgctacc ctccgcgaga 8280 
tgccgttctt ccgaatagca tcggtaacat 8340 
cccgctgacg ccgtcccgga ctgatgggct 8400 
ctgccggtcg gggagctgtt ggctggctgg 8460 
gacgcttaga caacttaata acacattgcg 8520 
ttttcaccag tgagacgggc "aacagctgat 8580 
gcagcaagcg gtccacgctg gtttgcccca 8640 
cgaaatcggc aaaatccctt ataaatcaaa 8700 
tccagtttgg aacaagagtc cactattaaa 8760 
aaccgtctat cagggcgatg gcccactacg 8820 
gtcgaggtgc cgtaaagcac taaatcggaa - 8880 
acggggaaag ccggcgaacg tggcgagaaa 8940 
cattcaggct gcgcaactgt tgggaagggc 9000 
agctggcgaa agggggatgt gctgcaaggc 9060 
agtcacgacg ttgtaaaacg acggccagtg 9120 
ttaaatattt attgataaaa taacaagtca 9180 
tattgatgca agtttaaatt cagaaatatt 9240 
gccgtagatg, aaagactgag tgcgatatta 9300 
gcttagctca tcgggggatc cgtcgaagct 9360 
agaaggcgat agaaggcgat gcgctgcgaa 9420 
aagcggt'cag cccattcgcc gccaagctct 9480 
tcctgatagc ggtccgccac acccagccgg 9540 
ttttccacca tgatattcgg .caagcaggca 9600 
tcgggcatgc gcgccttgag cctggcgaac 9660 
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agttcggctg 


gcgcgagccc 


ctgatgctct 


tcgtccagat 


catcctgatc 


gacaagaccg 


9720 


gcttccatcc 


gagtacgtgc 


tcgctcgatg 


cgatgtttcg 


cttggtggtc 


gaatgggcag 


9780 


gtagccggat 


caagcgtatg 


cagccgccgc 


attgcatcag 


ccatgatgga 


tactttctcg 


9840 


gcaggagcaa 


ggtgagatga 


caggagatcc 


tgccccggca 


cttcgcccaa 


tagcagccag 


9900 


tcccttcccg 


cttcagtgac 


eiacgtcgagc 


acagctgcgc 


aaggaacgec 


cgtcgtggcc 


9960 


agccacgata 


gccgcgctgc 


ctcgtcctgc 


agt teat tea 


gggeaccgga 


caggtcggtc 


10020 


ttgacaaaaa 


gaaccgggcg 


cccctgcgct 


gacagccgga 


acacggcggc 


atcagagcag 


10080 


ccgattgtct 


gttgtgccca 


gtcatagccg 


aatagcctct 


ccacccaagc 


ggccggagaa 


10140 


ccfcgcgtgca 


atccatcttg 


ttcaatccaa 


.gctcccatgg 


gccctcgact 


agagtcgaga 


10200 


tctggattga 


gagtgaatat 


gagactctaa- 


ttggataccg 


aggggaattt 


atggaacgtc 


10260 


agtggagcat 


ttttgacaag 


aaatatttgc 


tagctgatag 


tgaccttagg 


cgacttttga 


10320 


acgcgcaata 


atggtttctg 


acgtatgtgc 


ttagctcatt 


aaactccaga 


aacccgcggc 


10380 


tgagtggctc 


cttcaacgtt 


gcggttctgt 


cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


10440 


gtcatcggcg 


ggggtcataa 


cgtgactccc 


ttaattctcc 


gctcatgatc 


ttgatcccct 


10500 


gcgccatcag 


atccttggcg 


gcaagaaagc 


catceagttt 


actttgcagg 


gcttcccaac 


10560 


cttaccagag 


ggcgccccag 


ctggcaattc 


cggttcgctt 


gctgtccata 


aaaccgccca 


10620 


gtctagctat' 


cgccatgtaa 


gcccactgca 


agctacctgc 


tttctctttg 


cgcttgcgtt 


10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800' 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aacgtctaaa 


cccttgtaat 


ttgtttttgt 


tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gataaatttt 


tatatttggt 


actaaattta 


taacaccttt 


tatgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta 


ciatatttgct 


aatatttcta 


ctataggaga 


11100 


attaaagtga 


gtgaatatgg 


taccacaagg 


tttggagatt 


taattgttgc 


aatgctgcat 


11160 


ggatggcata 


tacaccaaac 


attcaataat 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


tttgaggtgc 


atgaacgtca 


cgtggacaaa 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat 


ggatgccctg 


tggaaagttt 


aaaaatattt 


11340. 


tggaaatgat 


ttgcatggaa 


gccatgtgta 


aaaccatgac 


atccacttgg 


aggatgeaat 


11400 



46 



aatgaagaaa 


actacaaatt 


tacatgcaac 


tagttatgca tgtagtctat 


ataatgagga 


11460 


ttttgcaata 


ctttcattca 


tacacactca 


ctaagtttta cacgattata 


atttcttcat 


11520 


agccagccca 


ccgcggtggg 


cggccgcctg 


cagtctagaa ggcctcctgc 


ttteiatgaga 11580 


tatgcgagac 


gcctatgatc 


gcatgatatt 


tgctttcaat tctgttgtgc 


acgttgtaaa 


11640 


aaacctgagc 


atgtgtagct 


cagatcctta 


ccgccggttt cggttcattc 


taatgaatat 


11700 


atcacccgtt 


actatcgtat 


ttttatgaat 


aatattctcc gttcaattta 


ctgattgtcc 


■11760 


gtcgacgaat 


tcgagctcgg 


cgcgcctcta 


gaggatcgat gaattcagat 


cggctgagtg 


11820 


gctccttcaa 


cgttgcggtt 


ctgtcagttc 


caaacgtaaa acggcttgtc. 


ccgcgtcatc 


11880 


ggcgggggtc 


ataacgtgac 


tcccttaatt 


ctccgctcat gatcagattg 


tcgtttcccg 11940 


ccttcagttt 


aaactatcag 


tgtttgacag 


gatatattgg cgggteiaacc 


taagagaaaa 


12000 


gagcgtttat 


tagaataatc 


ggatatttaa 


aagggcgtga aaaggtttat 


ccttcgtcca 


12060 


tttgtatgtg 


catgccaacc 


acagggttcc 


cca 
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<4O0> 21 
gatctggcgc 


cggccagcga gacgagcaag attggccgcc 


gcccgaaacg 


atccgacagc 


60 


gcgcccagca 


caggtgcgca ggcaaattgc accaacgcat 


acagcgccag 


cagaatgcca 


120 


tagtgggcgg. 


tgacgtcgtt cgagtgaacc agatcgcgca 


ggaggcccgg 


cagcaccggc 


180 


ataatcaggc 


cgatgccgac agcgtcgagc gcgacagtgc 


tcagaattac 


gafccaggggt 


240 


atgttgggtt 


tcacgtctgg cctccggacc agcctccgct 


ggtccgattg 


aacgcgcgga 


300 


ttctttatca 


ctgataagtt ggtggacata ttatgtttat 


cagtgataaa 


gtgtcaagca 360 


tgacaaagtt 


gcagccgaat acagtgatcc gtgccgccct 


ggacctgttg 


aacgaggtcg 


420 


gcgtagacgg 


tctgacgaca cgcaaactgg cggaacggtt 


gggggttcag 


cagccggcgc 


480 


tttactggca 


cttcciggaac aagcgggcgc tgctcgacgc 


actggccgaa 


gccatgctgg 


540 


cggagaatca 


tacgcattcg gtgccgagag ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg 


cagcttcagg caggcgctgc tcgcctaccg 


cgatggcgcg 


cgcatccatg 


660 



ccggcacgcg 


accgggcgca 


ccgcagatgg 


gcgaggcggg 


tttttcggcc 


ggggacgccg 


ctgttggggc 


cgtgcttgag 


gagcaggccg 


ccgttgaaca 


ggctccgctc 


tcgccgctgt 


ccggtccgga 


cgcagcgttc 


gagcagggac 


ggaggctcgt 


tgtcaggaac 


gttgaaggac 


tgccggagcg 


caaicccactc 


actacagcag 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


ccaagcctca 


cggccgcgcfc 


cggcctctct 


gctcactgac 


tcgctgcgct 


cggtcgttcg 


ggcggtaata 


cggttatcca 


cagaatcagg 


aggccagcaa 


aaggccagga 


accgtsiaaaa 


ccgcccccct 


gacgagcatc 


acaaaaatcg 


aggactataa 


agataccagg 


cgtttccccc 


gaccctgccg 


cttaccggat 


accfcgtccgc 


ccgctgcata 


accctgcttg 


ggggtcatta 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


ctaccgccgg 


cgtaacagat 


•gagggcaagc 


agggcagccc 


acctatcaag 


gtgtactgcc 


aggcggcggc 


ggccggcatg 


agcctgtcgg 


aaatcacggg 


cgtcgtggac 


tatgagcacg 


tgggccgcct 


gggcggcctg 


ctgaaactct 


tcacrtcratgc 


cacgatcctc 


Qccctcrctga 


gcaaggtcat 


gatgggcgtg 


gtccgcccga 


aacggccggg 


gggtgcgcgt 


gattgccaag 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgctcacc 


gggctggttg 


ccctcgccgc 
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aaacggccga 


cgcgcagctt cgcttcctct 


720 


tcaatgcgct 


gatgacaatc agctacttca 


780 


ffcgacagcga 


tgccggcgag cgcggcggca 


840 




gatagacgcc 


ttcgacgaag 


900 


tccrcggtgat 


tgtcgatgga 


ttggcgaaaa 


960 


cgagaaaggg 


tgacgattga tcaggaccgc 


1020 


agccatgtag 


acaacatccc- ctcccccttt 


1080 


tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctgcagcga 


gcggtatcag 


ctcactcaaa 


1260 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


gcrc ccrccrt t g 


ctggcgtttt 


tccataggct 


1380 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


ctfctcfccccfc 


tcgggaagcg 


tggcgctttt 


1560 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


GCCCaCCCGC 


gagcgggtgt 


tccttcttca 


1740 


acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 


ttccagacga 


acgaagagcg 


attgaggaaa 


1920 


cctacctgct 


ggccgtcggc 


cagggcjtaca 


1980 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400' 
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cgcgccagaa 


acgccgtcga 


agccgtgtgc 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


cctcgcggaa 


aacttggccc 


tcactgacag 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


cgactcaccc 


ggcgcggcgt 


tgacagatga 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa 


cgcctgattt 


tacgcgagtt 


tccbacagat 


2640 


gatgtggaca 


agcctgggga 


taagtgccct 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgacagatga 


ggggcgcgat 


ccttgacact 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


gcacctattg 


acatttgagg 


ggctgtccac 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


ccgcccgttt 


ttcggccacc 


gctaacctgt 


ctttt'aacct 


gcttttaaiac 


caatatttat 


2880 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


tgccccccct 


tctcgaaccc 


tcccggcccg 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


tgcgcccctc 


.ggccgcgaac 


ggcctcaccc 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


ttgccgggat 


cggggcagta 


acgggatggg. 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


ttgacgtgcc 


gcaggtgctg 


gcatcgacat 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


gcggcctggg 


tggcggcctg 


cccttcactt 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


cggggccggc 


aatttttacc 


ttgggcattc 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


tgttcggggg 


tgcgataaac 


ccagcgaacc 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


gtatgaaaac 


gagaattgga 


cctttacaga 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ctaccaagac 


gaagaggatg 


aagaggatga 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


tactgataag 


ataatatatc 


ttttatatag 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


ggcaaggcat 


aggcagcgcg 


cttatcaata 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


tgcatggact 


aatgcttgaa 


acccaggaca 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


tattgatagt 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


acagcgactt 


ccgtcccagc 


cgtgccaggt 


'3780 


gctgcctcag 


attcaggtta 


tgccgctceua 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttcc 


cttcaggcgg 


gat teat aca 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 


cgtcaaaggg 


tgacagcagg 


ctcataagac 


gccccagcgt 


cgccatagtg 


cgttcaccga 


3960 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


gcgatttagc 


cccgacatag 


ccccactgtt 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


tgcccggctg 


tatgcgcgag* 


gttaccgact 


gcggcctgag 


ttttttaagt 


gacgteiaaat 


4140 



cgtgttgagg ccaacgccca taatgcgggc 
catatcaatg attttctggt gcgtaccggg 
ccatgtttta cggcagtgag agcagagata 
acgcaccacc ccgtcagtag ctgaacagga 
agcacctcaa aaacaccatc atacactaaa 
tggtttcaeia atcggctccg tcgatactat 
aaeiagctgtt ttctggtatt taaggtttta 
cttgttataa ttagcttctt ggggtatctt 
.taaatggcta aaatgagaat atcaccggaa 
gtaaaagata cggaaggaat gtctcctgct 
aacctatatt taaaaatgac ggacagccgg 
gaaaaggaca tgatgctatg gctggaagga 
gaacggcatg atggctggag cciatctgctc 
gaagagtatg aagatgaaca aagccctgaa 
aggctctttc actccatcga catatcggat 
ttagccgaat tggattactt actgaataac 
gaagaagaca ctccaitttaa agatccgcgc 
cccgraagagg- aacttgtctt ttcccacggc 
gatggcaaag tatagtggctt tattgatctt 
gacattgcct tctgcgtccg gtcgatcagg 
ctattttttg acttactiggg gatcaagcct 
ctggatgaat tgttttagta cctagatgtg 
caccgacttc ttccgcatca agtgttttgg 
gggcaagggg tcgctggtat tcgtgcaggg 
cggccagacg gtctacggga ccgacttcat 
ggcaccaggc gggtcaaajtc aggaataagg 
cccgcaagga gggtgaatga atcggacgtt 
cgacgcgggg ttttccgccg aggatgccga 
gccccgcgaa accttccagt ccgtcggctc 
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tgttgcccgg 


catccaacgc 


cattcatggc 


4200 


ttgagaagcg 


gtgtaagtga 


actgcagttg 


4260 


gcgctgatgt 


ccggcggtgc 


ttttgccgtt 


4320 


gggacagctg 


atagacacag 


aagccactgg 


4380 


tcagtaagtt 


ggcagcatca 


cccataattg 


4440 


gttatacgcc 


aactttgaaa 


acaactttga 


4500 


gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 


taaatactgt 


agaaaagagg 


aaggaaiataa 


4620 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4680 


aaggtatata 


agctggtggg 


agaaaatgaa 


4740 


tataaaggga 


ccacctatga 


tgtggaacgg 


4800 


aagctgcctg 


ttccaaaggt 


cctgcsicttt 


4860 


atgagtgagg 


ccgatggcgt 


cctttgctcg 


4920' 


aagattatcg 


agctgtatgc 


ggagtgcatc 


4980 


tgtccctata 


cgaatagctt 


agacagccgc 


5040 


gatctggccg 


atgtggattg 


cgaaaactgg 


5100 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


gacctgggag 


acagcaacat 


ctttgtgaaa 


5220 


ggg^gaagcg 


gcagggcgga 


caagtggtat 


5280 


gaggatatcg 


gggaagaaca 


gtatgtcgag 


5340 


gattgggaga 


aaataaaata 


ttatatttta 


5400 


gcgcaacgat 


gccggcgaca 


agcaggagcg 


5460 


ctctcaggcc 


gaggcccacg 


gcaagtattt 


5520 


caagattcgg 


aataccaagt 


acgagaagga 


5580 


tgccgataag 


gtggattatc 


tggacaccaa 


5640 


gcacattgcc 


ccggcgtgag 


tcggggcaat 


5700 


tgaccggaag 


gcatacaggc 


aagaactgat 


5760 


aaccatcgca 


agccgcaccg 


tcatgcgtgc 


5820 


gatggtccag 


caagctacgg 


ccaagatcga 


5880 
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gcgcgacagc 


gtgcaactgg 


ctccccctgc 


cctgcccgcg 


ccatcggccg 


ccgtggagcg 


5940 


ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


tttggcgaag 


tcgatgacca 


tcgacacgcg 


6000 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag 


gacctggcaa 


aacaggtcag 


6060 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cacgaagcag 


cagatcaagg 


aaatgcagct 


6120 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 


6180 


ccgctctgcc 


ctgttcacca 


cgcgcaacaa 


gaaaatcccg 


cgcgaggcgc 


tgcaaaacaa 


6240 


ggtcattttc 


cacgtceiaca 


aggacgtgaa 


gatcacctac 


accggcgtcg 


agctgcgggc 


6300 


cgacgatgac 


gaactggtgt 


ggcagcaggt 


gttggagtac 


gcgaagcgca 


cccctatcgg 


6360 


cgagccgatc 


accttcacgt 


tctacgagct 


ttgccaggac 


ctgggctggt 


cgatcaatgg 


6420 


ccggtattac 


acgaaggccg 


aggaatgcct 


gtcgcgccta 


caggcgacgg 


cgatgggctt 


6480 


cacgtccgac 


cgcgttgggc 


acctggaatc 


ggtgtcgctg 


ctgcaccgct 


tccgcgtcct 


6540 


ggaccgtggc 


aagaaaacgt 


cccgttgcca 


ggtcctgatc 


gacgaggaaa 


tcgtcgtgct- 


6600 


gtttgctggc 


gaccactaca 


cgaaattcat 


atgggagaag 


taccgcaagc 


tgtcgccgac 


6660 


ggcccgacgg 


atgttcgact 


atttcagctc 


gcaccgggag 


ccgtacccgc 


tcaagctgga 


5720 


aaccttccgc 


ctcatgtgcg 


gatcggattc 


cacccgcgtg 


aagaagtggc 


gcgagcaggt 


6780 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


cggcctggtg 


gaacacgcct 


gggtcaatga 


6840 


tgacctggtg 


cattgcaaac 


gctagggcct . 


tgtggggtca 


gttccggctg 


ggggttcagc . 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca 


agcgggcact 


gctcgacgca 


cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


tacgaactgc 


cgataaacag 


aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggcttggag 


cggccgacgt 


gcaggatttc 


70-80 


cgcgagatcc 


gattgtcggc 


cctgaagaaa 


gctccagaga 


tgttcgggtc 


cgtttacgag 


7140 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


gctgaacggt 


tgcgagatgc 


cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga 


gatcattggg 


ctgtcggtct 


tcaaacagga 


ggacggcccc 


7260; 


aaggacgctc' 


acaaggcgca 


tctgtccggc 


gttttcgtgg 


agcccgaaca 


gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


g.cgggcgttg 


ccggcgggtt 


tattgctcgt 


gatgatcgtc 


7380 


cgacagattc 


caacgggaat 


ctggtggatg 


cgcatcttca 


tcctcggcgc 


acttaatatt 


7440 


tcgctattct 


ggagcttgtt 


gtttatttcg 


gtctaccgcc 


tgccgggcgg 


ggtcgcggcg 


7500 


acggtaggcg 


ctgtgcagcc 


gctgatggtc 


gtgttc'atct 


ctgccgctct 


gctaggtagc 


7560 


ccgatacgat 


tgatggcggt 


cctgggggct 


atttgcggaa 


ctgcgggcgt 


ggcgctgttg 


7620 
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gtgttgacac 


caaacgcagc 


gctagatcct 


gtcggcgtcg 


cagcgggcct 


ggcgggggcg 


7680 


gtttccatgg 


cgttcggaac 


cgtgctgacc 


cgcaagtggc 


aacctcccgt 


gcctctgctc 


7740 


acctttaccg 


cctggcaact 


gercggccgga 


ggacttctgc 


tcgttccagt 


agctttagtg 


7800 


tttgatccgc 


caatcccgat 


gcctacagga 


accaatgttc 


tcggcctggc 


gtggctcggc 


7860 


ctgatcggag 


cgggtttaac 


ctacttcctt 


tggttccggg 


ggatctcgcg 


actcgaacct 


7920 


acagttgttt 


ccttactggg 


ctttctcagc 


cccagatctg 


gggtcgatca 


gccggggatg 


79B0 


catcaggccg 


acagtcggaa 


"cttcgggtcc 


ccgacctgta 


ccattcggtg 


agcaatggat 


8040 


aggggagttg 


atatcgtcaa 


cgttcacttc 


taaagaaata 


gcgccactca 


gcttcctcag 


8100 


cggctttatc 


cagcgatttc 


ctattatgtc 


ggcatagttc 


tcaagatcga 


cagcctgtca 


8160 


cggttaagcg 


agaaatgaat 


aagaaggctg 


ataattcgga 


tctctgcgag 


ggagatgata 


8220 


tttgatcaca 


ggcagcaacg 


ctctgtcatc 


gttacaatca 


acatgctacc 


ctccgcgaga 


8280 


tcatccgtgt 


ttcaaacccg 


gcagcttagt 


tgccgttctt 


ccgaatagca 


tcggtaacat 


8340 


gagcaaagtc 


tgccgcctta 


caacggctct 


cccgctgacg 


ccgtcccgga 


ctgatgggct 


8400 


gcctgtatcg 


agtggtgatt 


ttgtgccgag 


ctgccggtcg. 


gggagctgtt 


ggctggctgg 


8460 


tggcaggata 


tattgtggtg 


taaacaaatt 


gacgcttaga 


caacttaata 


acacattgcg 


8520 


gacgttttta 


atgtactggg 


gtggtttttc 


ttttcaccag 


tgagacgggc 


aacagctgat 


8580 


tgcccttcac 


cgcctggccc 


tgagagagtt 


gcagcaagcg 


gtccacgctg 


gtttgcccca 


8640 


gcaggcgaaa 


atcctgtttg 


atggtgglitc 


cgaaatcggc 


aaaatccctt 


ataaatcaaa 


8700 


agaatagccG 


gagatagggt 


tgagtgttgt 


tccagtttgg 


aacaagagtc 


cactattaaa 


8760 


gaacgtggac 


tccaacgtca 


aagggcgaaa 


aaccgtctat 


cagggcgatg 


gcccactacg 


8820 


tgaaccatca 


cccaaafccaa 


gttttttggg 


gtcgaggtgc 


cgtaaagcac 


taaatcggaa 


8880 


ccctaaaggg 


agcccccgat 


ttagagcttg 


acggggaaag 


ccggcgaacg 


tggcgagaaa 


8940 


ggaagggaag 


aaagcgaaag 


gagcgggcgc 


cattcaggct 


gcgcaactgt 


tgggaagggc 


9000 


gatcggtgcg 


ggcctcttcg 


ctattacgcc 


agctggcgaa 


agggggatgt 


gctgcaaggc 


9060 


gattaagttg 


ggtaacgcca 


gggttttccc 


agtcacgacg 


ttigtaaaacg 


acggccagtg 


9120 


aattaattcc 


catcttgaaa 


gaaatatagt 


ttaaatattt 


attgataaaa 


taacaagtca 


9180 


ggtattatag 


tccaagcaaa 


aacataaatt 


tattgatgca 


agtttaaatt 


.cagaaatatt 


9240 


tcaataactg 


attatatcag 


ctggtacatt 


gccgtagatg 


aaagactgag 


tgcgatatta 


9300 


tgtgtaatac 


ataaattgat 


gatatagcta 


.gcttagctca 


tcgggggatc 


cgtcgaagct 


9360 
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agcttgggtc 


ccgctcagaa gaactcgtca 


agaeiggcgat 


agaaggcgat 


gcgctgcgaa 


9420 


tcgggagcgg 


cgataccgta aagcacgagg 


aagcggtcag 


cccattcgcc 


gccaagctct 


9480 


tcagcaatat 


cacgggtagc 


caacgctatg 


tcctgatagc 


ggtccgccac 


acccagccgg 


9540 


ccacagtcga 


tgaatccaga 


aaagcggcca 


ttttccacca 


tgatattcgg 


caagcaggca 


9600 


tcgccatggg 


tcacgacgag atcctcgccg 


tcgggcatgc 


gcgccttgag 


cctggcgaac 


9660 


agttcggctg 


gcgcgagccc 


ctgatgctct 


tcgtccagat 


catcctgatc 


gacaagaccg 


9720 


gcttccatcc 


gagtacgtgc 


tcgotcgatg 


cgatgtttcg 


cttggtggtc 


gaatgggcag 


9780 


gtagccggat 


caagcgtatg 


^cagccgccgc 


attgcatcag 


ccatgatgga 


tactttctcg 


9840 


gcaggagcaa 


ggtgagatga 


caggagatcc 


tgccccggca 


cttcgcccaa 


tagcagccag 


9900 


tcccttcccg 


cttcagtgac 


aacgtcgagc 


acagctgcgc 


aaggaacgcc 


cgtcgtggcc 


9960 


agccacgata 


gccgcgctgc 


ctcgtcctgc 


agttcattca 


gggcaccgga 


caggtcggtc 


10020 


ttgacaaaaa 


gaaccgggcg 


cccctgcgct 


gacagccgga 


acacggcggc 


atcagagcag 


10080 


ccgattgtct 


gttgtgccca 


gtcatagccg 


aatagcctct 


ccacccaagc 


ggccggagaa 


10140 


cctgcgtgca 


atccatcttg 


ttcaatccaa 


gcticccatgg 


gccctcgact 


agagtcgaga 


10200 


tctggattga 


gagtgaatat 


gagactctaa 


ttggataccg 


aggggaattt 


atggaacgtc 


10260 


agtggagcat 


ttttgacaag 


aaatatttgc 


tagctgatag 


tgaccttagg 


cgacttttga 


10320 


acgcgcaata 


atggtttctg 


acgtatgtgc 


ttagctcatt 


aaactccaga 


aacccgcggc 


10380 


tgagtggctc 


cttcaacgtt 


gcggttctgt 


cagttccciaa 


cgtaaaacgg 


cttgtcccgc 


10440 


gtcatcggcg 


ggggtcataa 


cgtgactccc 


ttaattctcc 


gctcatgatc 


ttgatcccct 


10500 


gcgccatcag 


atccttggcg 


gcaagaaagc 


• catccagttt 


actttgcagg 


gcttcccaa'c 


10560 


cttaccagag 


ggcgccccag 


ctggcaattc 


cggttcgctt 


gctgtccata 


aaaccgccca. 


106.20 


gtctagctat 


cgccatgtaa 


gcccactgca 


agctacctgc 


tttctctttg 


cgcttgcgtt. 10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


-actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aacgtctaaa 


cccttgtaat 


ttgtttttgt 


tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gataaatttt 


tatatttggt 


actaaattta 


taacaccttt 


tatgctaacg 10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt 


t'ttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta 


aatatttgct 


aatatttcta 


ctataggaga 


11100 
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attaaagtga 


gtgaatatgg 


taccacaagg tttggagatt 


taattgttgc aatgctgcat 


11160 


ggatggcata 


tacaccaaac 


attcaiataat tcttgaggat 


aataatggta ccacacaaga 


11220 


tttgaggtgc 


atgaacgtca 


cgtggaceiaa aggtttagta 


atttttcaag acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat ggatgccctg 


tggaaagttt aaaaatattt 


11340 


tggaaatgat 


ttgcatggaa 


gccatgtgta aaaccatgac 


atccacttgg aggatgcaat 


11400 


aatgaagaaa 


actacaaatt 


tacatgcaiac tagttatgca 


tgtagtctat ataatgagga 


11460 


ttttgcaata 


ctttcattca 


tacacactca ctaagtttta 


cacgattata atttcttcat 


11520 


agccagcgga 


tccgatatcg 


ggcccgctag cgttaaccct 


gctttaatga gatatgcgag 


11580 


acgcctatga 


tcgcatgata 


tttgctttca attctgttgt 


gcacgttgta aaasiacctga 


11640 


gcatgtgtag 


ctcagatcct 


taccgccggt ttcggttcat 


tctaatgaat atatcacccg 


11700 


ttactatcgt 


atttttatga 


ataatattct ccgttcaatt 


tactgattgt ccgtcgacga 


11760 


attcgagctc 


ggcgcgcctc 


tagaggatcg atgaattcag 


atcggctgag tggctccttc 


11820 


aacgttgcgg 


ttctgtcagt 


tccaaacgta aaacggcttg 


tcccgcgtca tcggcggggg 


11880 


tcataacgtg 


actcccttaa 


ttctccgctc atgatcagat 


tgtcgtttcc cgccttcagt 


11940" 


ttaaactatc 


agtgtttgac 


aggatatatt ggcgggtaaa 


cctaagagaa aagagcgttt 


12000 


attagaataa 


tcggatattt 


aaaagggcgt gaaaaggttt 


atccttcgtc catttgtatg 


12060 


tgcatgccaa 


ccacagggtt 


cccca 




12085 



<210> 22 
<211> 12079 
<212> DKTA 
<213> Unknown 

<220> 

<223> pflanzliclier Expressionsvektor loit einer 
Promotor-Terminator-Expressionskassette 

<400> 22 • 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 
gcgcccagca caggtgcgca ggcaaattgc accaacgcat .acagcgccag cagaatgcca 120 
tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg cagcaccggc 180 
ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac gatcaggggt 240 
atgttgggtt tcacgtctgig cctccggacc agcctccgct ggtccgattg aacgcgcgga 300 
ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa gtgtcaagca 360 
tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg aacgaggtcg 420 
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gcgtagacgg 


tctgacgaca 


cgcaaactgg 


cggaacggtt 


gggggttcag 


cagccggcgc 




tttactggca 


cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa 


gccatgctgg 




cggagaatca 


tacgcattcg 


gtgccgagag 


ccgacgacga 


ctggcgctca 


ttcctgatcg 




ggaatgcccg 


cagcttcagg 


caggcgctgc 


tcgcctaccg 


cgatggcgcg 


cgcatccatig 




ccggcacgcg 


accgggcgca 


ccgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


720 


gcgaggcggg 


tttttcggcc 


ggggacgccg 


tcaatgcgct 


gatgacaatc 


age tact tea 


780 


ctgttggggc 


cgtgcttgag 


gagcaggccg 


gcgacagcga 


tgccggcgag 


cgcggcggca 


840 


ccgttgaaca 


ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


ttcgacgaag 


900 


ccggtccgga 


cgcagcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


ttggcgaaaa 


9o0 


crgaggctcgt 


tgtcaggaac 


gttgaaggac 


cgagaaaggg 


tgacgattga* 


tcaggaei^gc 


1020 


tgccggagcg 


caacccactc 


actacagcag 


agccatgtag 


acaacatccc 


ctcccccttt 


1080 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ccaagcctca 


cggccgcgct 


cggcctctct 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctcactgac 


tcgctgcgct 


cggtcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1260 


ggcggtaata 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


aggccagcaa 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


ccgcccccct 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttt 


1560 


ccgctgcata 


accctgcttc 


ggggtcatta 


tagcgatutt 


ctcggtatat 


ccatcctttt 


1620 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1 O A 

looO 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


gcccacccgc 


gagcgggtgt 


cccutcticca 


174U 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


acgggaatcc 


tgctctgcga 


ggctggccgg 


I O A A 

loUO 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


ggatggctga 


tgaaaccaag 


ccaaccagga 


loOO 


agggcagccc 


acctatcaag 


gtgtactgcc 


ttccagacga 


acgaagagcg 


attgaggacia 


1920 


aggcggcggc 


ggccggcatg 


agcctgtcgg 


cctacctgct 


ggccgtcggc 


cagggctaca 


19S0 


aaatcacggg 


cgtcgtggac 


tatgagcacg 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


tgggccgcct 


gggcggcctg 


ctgaaactct 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


tcggtgatgc 


cacgatcctc 


gccctgctgg 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 
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gcaaggtcat 


gatgggcgtg 


gtccgcccga 


aacggccggg 


gggtgcgcgt 


gattgccaag 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgctcacc 


gggctggttg 


ccctcgccgc 


cgcgccagaa 


acgccgtcga 


agccgtgtgc 


cctcgcggaa 


aacttggccc 


tcactgacag 


cgactcaccc 


ggcgcggcgt 


tgacagatga 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa 


gatgtggaca 


agcctgggga 


taagtgccct 


tgacagatga 


ggggcgcgat 


ccttgacact 


gcacctattg 


acatttgagg 


ggctgtccac 


ccgcccgttt 


ttcggccacc 


gctaacctgt 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


tgc cccccct 


tctcgaiaccc 


tcccggcccg 


tgcgcccctc 


ggccgcgaac 


ggcctcaccc 


ttgccgggat 


cggggcagta 


acgggatggg 


ttgacgtgcc 


gcaggtgctg 


gcatcgacat 


gcggcctggg 


tggcggcctg 


cccttcactt 


cggggccggc 


aatttttacc 


ttgggcattc 


tgttcggggg 


tgcgataaac 


ccagcgaacc 


gtatgaaaac 


gagaattgga 


cctttacaga 


ctaccaagac 


gaagaggatg 


aagaggatga 


tactgataag 


ataatatatc 


ttttatatag 


ggcaaggcat 


aggcagcgcg 


cttatcaata 




a a trrcttcfaa 


acccaggaca 


attgggtaat 


gactccaact 


tattgatagt 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


gc tgcctcag 


attcaggtta 


tgccgctcaa 


gcagctttcc 


cttcaggcgg 


gattcataca 



gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


ggggcaggct 


cgattfccggc 


cggcgacgtg 


2580 


cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


cttttaacct* 


gcttttaaac 


caatatttat 


2880 


gtgcgcgtga ccgcgcacgc 


cgaagggggg 


2940 


ctaacgcggg cctcccatcc 


ccccciggggc 


3000 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


tcagcgacca ggtgccgggc 


agtgagggcg 


3180 


cggccgtcgg ggcattcacg 


gacttcatgg 


3240 


ttggcatagt ggtcgcgggt 


gccgtgctcg 


3300 


atttgaggtg ataggtaaga 


ttataccgag 


3360 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


aagatatcgc cgtatgtaag 


gatttcaggg 


3540 


tatctataga atgggcaaag 


cataaaaact 


3600 


ataaccttat agcttgtaaa 


ttctatcata 


3660 


gttttatgtt cagataatgc 


ccgatgactt 


3720 


acagcgactt ccgtcccagc 


cgtgccaggt 


3780 


ttcgctgcgt atatcgcttg 


ctgattacgt 


3840 


gcggccagcc atccgtcatc 


catatcacca 


3900 



cgtcaaaggg 


tgacagcagg 


ctcataagac 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


gcgatttagc 


cccgacatag 


ccccactgtt 


tgcccggctg tatgcgcgag 


gttaccgact 


cgtgttgagg ccaacgccca 


taatgcgggc 


catatcaatg attttctggt 


gcgtaccggg 


ccatgtttta cggcagtgag 


agcagagata 


acgcaccacc 


ccgtcagtag 


ctgaacagga 


agcacctcaa aaacaccatc 


atacactaaa 


fcggtttcaaa atcggctccg 


tcgatactat 


aaaagctgtt 


•ttctggtatt 


taaggtbtta 


cttgttataa 


ttagcttctt 


ggggtatctt 


taaatggcta 


aaatgagaat 


atcaccggaa 


gtaaaagata 


cggaaggaat 


gtctcctgct 


aacctatatt 


taaaaatgac 


ggacagccgg 


gaaaaggaca 


tgatgctatg 


gctggaagga 


gaacggcatg 


atggctggag 


cciatctgctc 


gaagagtatg 


aagatgaaca 


aagccctgaa 


aggctctttc 


actccatcga 


catatcggat 


ttagccgaat 


tggattactt 


actgaataac 


gaagaagaca 


ctccatttaa 


agatccgcgc 


cccgaagagg 


aacttgtctt 


ttcccacggc 


gatggcaaag 


taagtggctt 


tattgatctt 


gacattgcct 


tctgcgtccg 


gtcgatcagg 


ctattttttg 


acttactggg 


gaucaagcc u 


ctggatgaat 


tgttttagta 


cctagatgtg 


caccgacttc 


ttccgcatca 


agtgttttgg 


gggcaagggg 


tcgctggtat 


tcgtgcaggg 


cggccagacg 


gtctacggga 


ccgacttcat 



56 



gccccagcgt 


cgccatagtg 


cgttcaccga 


3960 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


gcggcctgag 


ttttttaagt 


gacgtaaaat 


4140 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 


ttgagaagcg 


gtgtaagtga 


actgcagttg 


4260 


gcgctgatgt 


ccggcggtgc 


ttttgccgtt 


4320 


gggacagctg 


atagacacag 


aagc'cactgg 


4380 


tcagtaagtt 


ggcagcatca 


cccataatt^' 


4440. 


gttatacgcc 


aactttgaaa 


acaactttga 


4500 


gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 


taaatactgt 


agaaaagagg 


aaggaaataa 


4620 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4680 


^aggtatata 


agctggtggg 


agaaaatgaa 


4740 


tataaaggga 


ccacctatga 


tgtggaacgg 


4800 


aagctgcctg 


ttccaaaggt 


cctgcacttt 


4860 


atgagtgagg 


ccgatggcgt 


cctttgctcg 


4920 


aagattatcg 


agctgtatgc 


ggagtgcatc 


4980 


tgtccctata. 


cgaatagctt 


agacagccgc 


5040 


gatctggccg 


atgtggattg 


cgaaaactgg 


5100 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


gacctgggag 


acagcaacat 


ctttgtgaaa 


5220 


gggagaagcg 


gcagggcgga 


caagtggtat 


•5280 


gaggatatcg 


gggaagaaca 


gtatgtcgag 


5340 


aat tcrcrcracra 


aaataaaata 


ttatatttta 


5400 


gcgcaacgat 


gccggcgaca 


agcaggagcg 


5460 


ctctcaggcc 


gaggcccacg 


gcaagtattt 


5520 


caagattcgg 


aataccaagt 


acgagaagga 


5580 


tgccgataag 


gtggattatc 


tggacaccaa 


5640 
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ggcaccaggc 


gggtcaaatc 


aggaataagg 


gcacattgcc 


ccggcgtgag tcggggcaat 


5700 


cccgcaagga 


gggtgaatga 


atcggacgtt 


tgaccggaag , 


gcatacaggc aagaactgat 


5760 


cgacgcgggg 


ttttccgccg 


aggatgccga 


aaccatcgca 


agccgcaccg tcatgcgtgc 


5820 


gccccgcgaa 


accttccagt 


ccgtcggctc 


gatggtccag 


caagctacgg ccaagatcga 


5880 


gcgcgacagc 


gtgcaactgg 


ctccccptgc 


cctgcccgcg 


ccatcggccg ccgtggagcg 


5940 


ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


tttggcgaag 


tcgatgacca tcgacacgcg 


6000 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag 


gacctggcaa . aacaggtcag 


6060 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cacgaagcag 


cagatcaagg aaatgcagct 


6120 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa acgacacggc 


6180 


ccgctctgcc 


ctgttcacca 


cgcgcaacaa 


gaaaatcccg 


cgcgaggcgc bgcaaaacaa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


accggcgtcg agctgcgggc 


6300 


cgacgatgac 


gaactggtgt 


ggcagcaggt 


gttggagtac 


gcgaagcgca cccctatcgg 


6360 


cgagccgatc 


accttcacgt 


tctacgagct 


ttgccaggac 


ctgggctggt cgatcaatgg 


6420 


ccggtattac 


acgaaggccg 


aggaatgcct 


gtcgcgccta 


caggcgacgg cgatgggctt 


6480 


cacgtccgac 


cgcgttgggc 


acctggeiatc 


ggtgtcgctg 


ctgcaccgct tccgcgtcct 


6540 


ggaccgtggc 


aagaaaacgt 


cccgttgcca 


ggtcctgatc 


gacgaggaaa tcgtcgtgct 


6600 


gtttgctggc 


gaccactaca 


cgaaattcat 


atgggagaag 


taccgcaagc tgtcgccgac 


6660 


ggcccgacgg 


atgttcgact 


atttcagctc 


gcaccgggag 


ccgtacccgc tcaagctgga 


6720 


aaccttccgc 


ctcatgtgcg 


gatcggattc 


cacccgcgtg 


aagaagtggc gcgagcaggt 


6780 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


cggcctggtg 


gaacacgcct gggtcaatga 


6840 


tgacctggtg 


cattgcaaac 


gctagggcct 


tgtggggtca 


gttccggctg ggggttcagc 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca 


agcgggcact 


gctcgacgca cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


tacgaactgc 


cgataaacag- aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggcttggag 


cggccgacgt gcaggatttc 


7080 


cgcgagatcc 


gaccgtcggc 


cc cgaagaaa 


gc u c c agaga 


(«yuucgggi*c C9t-uuawyciy 


71 40 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


gctgaacggt 


tgcgagatgc cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga 


gatcattggg 


ctgtcggtct 


tcaaacagga ggacggcccc 


7260 


aaggacgctc 


acaaggcgca 


tctgtccggc 


gttttcgtgg 


agcccgaaca gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt 


tattgctcgt gatgaccgtc 


7380 
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cgacagattc caacgggaat ctggtggatg cgcatcttca tcctcggcgc acttaatatt 7440 
tcgctattct ggagcttgtt gtttatttcg gtctaccgcc tgccgggcgg ggtcgcggcg 7500 
acggtaggcg ctgtgcagcc gctgatggtc gtgttcatct ctgccgctct gctaggtagc 7560 
ccgatacgat tgatggcggt cctgggggct atttgcggaa ctgcgggcgt ggcgctgttg 7620 
gtgttgacac caaacgcagc gctagatcct gtcggcgtcg cagcgggcct ggcgggggcg 7680 
gtttccatgg cgttcggaac cgtgctgacc cgcaagtggc aacctcccgt gcctctgctc 7740 
acctttaccg cctggcaact ggcggccgga ggacttctgc tcgttccagt .agctttagtg 7800 
tttgatccgc caatcccgat gcctacagga accaatgttc tcggcctggc gtggctcggc 7860 
ctgatcggag cgggtttaac ctacttcctt Cggttccggg ggatctcgcg actcgaacct 7920 
acagttgttt-.ccttactggg ctttctcagc cccagatctg gggtcgatca gccggggatg 7980 
catcaggccg acagtcggaa cttcgggtcc ccgacctgta ccattcggtg agcaatggat 8040 
aggggagttg atatcgtcaa cgttcacttc taaagaaata- gcgccactca gcttcctcag 8100 
cggctttatc cagcgatttc ctattatgtc ggcatagttc 'tcaagatcga cagcctgtca 8160 
cggttaagcg agaaatgaat aagaaggctg ataattcgga tctctgcgag ggagatgata 8220 
tttgatcaca ggcagcaacg ctctgtcatc gttacaatca acatgctacc ctccgcgaga 8280 
■ tcatccgtgt ttcaaacccg gcagcttagt tgccgttctt ccgaatagca tcggtaacat 8340 
gagcaaagtc tgccgcctta caacggctct cccgctgacg ccgtcccgga ctgatgggct 8400 
gcctgtatcg agtggtgatt ttgtgccgag ctgccggtcg gggagctgtt ggctggctgg 8460 
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacatfcgcg 8520 
gacgttttta atgtactggg gtggtttttc ttttcaccag tgagacgggc aacagctgat 8580 
tgcccttcac cgcctggccc tgagagagtt gcagcaagcg gtccacgctg gtttgcccca 8640 
gcaggcgaaa atcctgtttg atggtggttc cgaaatcggc aaaatCGCtt ataaatcaaa 8700 
agaatagccc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 8760 
gaacgtggac .tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 8820 
tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 
ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg fcggcgagaaa 8940 
ggaagggaag aaagcgaaag gagcgggcgc cattcaggct gcgcaactgt tgggaagggc 9000 
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 9060 
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 9120 
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aattaattcc 


catcttgaaa 


gaaatatagt 


ttasiatattt attgataaaa 


taacaagtca 9180 


ggtattatag 


tccaagcaaa 


aacataaatt 


tattgatgca agtttaaatt 


cagaaatatt 9240 


tcaataactg 


attatatcag 


ctggtacatt 


gccgtagatg aaagactgag 


tgcgatatta 9300 


tgtgtaatac 


ataaattgat 


gatatagcta 


gcctagctca tcgggggatc 


cgtcgaagct 9360 


agcttgggtc 


ccgctcagaa 


gaactcgtca 


agaaggcgat agaaggcgat 


gcgctgcgaa 9420 


tcgggagcgg 


cgataccgta 


aagcacgagg 


aagcggtcag cccattcgcc 


gccaagctct 9480 


tcagcaatat 


cacgggtagc 


caacgctatg 


tcctgatagc ggtccgccac 


acccagccgg 9540 


ccacagtcga 


tgaatccaga 


aaagcggcca 


ttttccacca tgatattcgg 


caagcaggca 9500 


tcgccatggg 


tcacgacgag 


atcctcgccg 


tcgggcatgc gcgccttgag 


c ctggcgaac - 9 6 6 0 


agttcggctg 


gcgcgagccc 


ctgatgctct 


tcgtccagat catcctgatc 


gacaagaccg 9720 


gcttccatcc 


gagtacgtgc 


tcgctcgatg 


cgatgtttcg cttggtggtc 


gaatgggcag 9780 


gtagccggat 


caagcgtatg 


cagccgccgc 


attgcatcag ccatgatgga 


tactttctcg 9840 


gcaggagcaa 


ggtgagatga 


caggagatcc 


tgccccggca cttcgcccaa 


tagcagccag 9900 


tcccttcccg 


cttcagtgac 


aacgtcgagc 


acagctgcgc aaggaacgcc 


.cgtcgtggcc 9960 


agccacgata 


gccgcgctgc 


ctcgtcctgc 


agttcattca gggcaccgga 


caggtcggtc 10020 


ttgacaaaaa 


gaaccgggcg 


cccctgcgct 


gacagccgga acacggcggc 


atcagagcag 10080 


ccgattgtct 


gttgtgccca 


gtcatagccg 


aatagcctct ccacccaagc 


ggccggagaa 10i40 


cctgcgtgca 


atccatcttg 


ttcaatccaa 


gctcccatgg gccctcgact 


agagtcgaga 10200 


tctggattga 


gagttgaatat 


gagactctaa 


ttggataccg aggggaafctt 


atggaacgtc 10260 


agtggagcat 


ttttgacaag 


aaatatttgc 


tagctgatag tgaccttagg 


cgacttttga 10320 


acgcgcaata 


atggtttctg 


acgtatgtgc 


ttagctcatt aaa.ctccaga 


aacccgcggc 10380 


tgagtggctc 


cttcaacgtt 


gcggttctgt 


cagttccaaa cgtaaaacgg 


cttgtcccgc 10440 


gtcatcggcg 


ggggtcataa 


cgtgactccc 


ttaattctcc gctcatgatc 


ttgatcccct 10500 


gcgccatcag 


atccttggcg 


gcaagaaagc 


catccagttt actttgcagg 


gcttcccsiac 10560 


cttaccagag 


aacCTCcccag 


ctggcaattc 


cggttcgctt gctgtccata 


aaaccgccca 10620 


gtctagctat 


cgccatgtaa 


gcccactgca 


agctacctgc tttctctttg 


cgcttgcgtt 10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg ggtcagcacc 


gtttctgcgg 10740 


actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg cgccctgagt 


gcttgcggca 10800 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag ctcctcgagc 


aaatttacac 10860 



60 



attgccacta 


aacgtctaaa 


cccttgtaat 


ttgtttttgt 


tttactatgt gtgttatgta 


10920 


tttgatttgc 


gataaatttt 


tatatttggt 


actaaattta 


taacaccttt tatgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt tttgtcttct 


11040 


aaatacatat 


actaatcaac 


tgg^aatgta 


aatatttgct 


aatatttcta ctataggaga 


liloo 


attaaagi^ga 


gtgaatatgg ■ 


taccacaagg 


tttggagatt 


taattgttgc aatgctgcat 


11160 


ggatggcata 


tacaccaaac 


attcaataat 


tcttgaggat 


aataatggta ccacacaaga 


11220 


tttcraaatac 


atgaacgtca 


cgtggacaaa 


aggtttagta 


atttttcaag acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat 


ggatgccctg 


tggaaagttt aaaaatattt 


11340 


tggaaatgat 


ttgcatggaa 


gccatgtgta 


aaaccatgac 


atccacttgg aggatgcaat 


11400 


aatgaagaaa 


actacaaatt 


tacatgcaac 


tagttatgca 


tgtagtctat ataatgagga 


11460 


tttitgcaata 


ctttcalitica 


tacacaclica 


ctaagtttta 


cacgattata atttcttcat 


11520 


agccagcaga 


tctgccggca 


tcgatcccgg 


gccatggcct 


gctttciatga gatatgcgag 


11580 


acgcctatga 


tcgcatgata 


tttgctttca 


attctgttgt 


gcacgttgta aaaaacctga 


11640 


acatatotao 


ctcagatcct 


taccgccggt 


ttcggttcat 


tctaatgaat atatcacccg 


11700 


ttactatcgt 


atttttatga 


ataatattct 


ccgttcaatt 


tact gat tgt ccgtcgacga 


11760 


crctccrcrccrccr 


cctctagagg 


atcgatgaat 


tcagatcggc 


tgagtggctc cttcaacgtt 


11820 


gcggttctgt 


cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


gtcatcggcg ggggtcataa 


11880 


cgtgactccc 


ttaattctcc 


gctcatgatc 


agattgtcgt 


ttcccgcctt cagtttaaac 


11940 


tatcagtgtt 


tgacaggata 


tattggcggg 


taaacctaag 


agaaaagagc gtttattaga 


12000 


ataatcggat 


atttaaaagg 


gcgtgaaaag 


gtttatcctt 


cgtccatttg tatgtgcatg 


12060 


ccaaccacag 


ggttcccca 
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gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 



gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca 120 
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tagtgggcgg 


tgacgtcgtt 


cgagtgaacc agatcgcgca 


ggaggcccgg 


cagcaccggc 


180 


ataatcaggc 


cgatgccgac 


agcgtcgagc gcgacagtgc 


tcagaattac 


gatcaggggt 


240 


atgttgggtt 


tcacgtctgg 


cctccggacc agcctccgct 


ggtccgattg 


aacgcgcgga 


3Q0 


ttctttatca 


ctgataagtt 


ggfcggacata ttatgtttat 


cagtgataaa 


gtgtcaagca 


360 


tgacaaagtt 


gcagccgaat 


acagtgatcc gtgccgccct 


ggacctgttg 


aacgaggtcg 


420 


gcgtagacgg 


tctgacgaca 


cgcaaactgg cggaacggtt 


gggggttcag 


cagccggcgc 


480 


tttactggca 


cttcaggaac 


aagcgggcgc tgctcgacgc 


actggccgaa 


gccatgctgg 


540 


cggagaatca 


tacgcattcg 


gtgccgagag ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg 


cagcttcagg 


caggcgctgc tcgcctaccg 


cgatggcgcg 


cgcatccatg 


660 


ccggcacgcg 


accgggcgca 


ccgcagatgg aaacggccga 


cgcgcagctt 


cgcttcctct 


720 


gcgaggcggg 


tttttcggcc 


ggggacgccg. tcaatgcgct 


gatgacaatc 


agctacttca 


780 


ctgttggggc 


cgtgcttgag 


gagcaggccg gcgacagcga 


tgccggcgag 


cgcggcggca 


840 


ccgttgaaca 


ggctccgctc 


tcgccgctgt tgcgggccgc 


gatagacgcc 


ttcgacgaag 


900 


ccggtccgga 


cgcagcgttc 


gagcagggac tcgcggtgat 


tgtcgatgga 


ttggcgaaaia 


960 


ggaggctcgt 


tgtcaggaac 


gttgaaggac cgagaaaggg 


tgacgattga 


tcaggaccgc 


1020 


tgccggagcg 


caacccactc 


actacagcag agccatgtag' 


acaacatccc 


ctcccccttt 


1080 


ccaccgcgtc 


agacgcccgt 


agcagcccgc tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ccaagcctca 


cggccgcgct 


cggcctc.tct ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctcactgac 


tcgctgcgct 


cggtcgttcg gctgcggcga 


gcggtatcag 


ctcactcaaa 


1260 


ggcggtaata 


cggttatcca 


cagaatcagg ggataacgca 


ggaaagaaca 


tgtgiagcaaa 


1320 


aggccagcaa 


aaggccagga 


accgtaaaaa ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


ccgcccccct 


gacgagcatc 


acaaaaatcg acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttccccc tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


cttaccggat 


acctgtccgc ctttctccct 


tcgggaagcg 


tggcgctttt 


1560 


ccgctgcata 


accctgcttc 


ggggtcatta tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


tcgcacgata 


tacaggattt 


tgccaaaggg ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


ggcgtcagcc- 


gggcaggata 


ggtgaagtag gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggtgctca acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ctaccgccgg 


cgtaacagat 


gasrggcaagc ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 
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agggcagcGC 


acctatcaag 


gtgtactgcc 


ttccagacga 


acgaagagcg 


attgaggaaa 


1920 


aggcggcggc 


ggccggcatg 


agcctgtcgg 


cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


aaatcacggg 


cgtcgtggac 


tatgagcacg 


tccgcgagct 


Sgcccgcatc 


aatggcgacc 


2040 


tgggccgcct 


gggcggcctg 


ctgaaactct 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


tcggtgatgc 


cacgatcctc 


gccctgctgg 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 


gcaaggtcat 


gatgggcgtg 


gtccgcccga 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


aacggccggg 


gggtgcgcgt 


gattgccaag 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


gacgctcacc 


gggctggttg 


ccctcgccgc 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400 


cgcgccagaa . 


acgccgtcga 


agccgtgtgo 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


cctcgcggaa 


aacttggccc 


tcactgacag 


atgaggggcg 


gacgttgaca 


cfctgaggggc 


2520 


cgactcacGc 


ggcgcggcgt 


tgacagatga 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


gagcbggcca 


gcctcgc£iaa 


tcggcgaaaa 


cgcctgattt 


tacgcgagtt 


tcccacaigat 


2640 


gatgtggaca 


agcctgggga 


taagtgccct 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgacagatga 


ggggcgcgat 


ccttgacact 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


gcacctattg 


acatttgagg 


ggctgtccac 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


ccgcccgttt 


ttcggccacc 


.gctaacctgt 


cttttaacct 


gcttttaaac 


caatatttat 


2880 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


tgccccccct 


tctcgaaccc 


tcccggcccg 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


tgcgcccctc 


ggccgcgaac 


ggcctc^accc 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


ttgccgggat 


cggggcagta 


acgggatggg 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


ttgacgtgcc 


gcaggtgctg 


gcatcgacat 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


gcggcctggg 


tggcggcctg 


cccttcactt 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


cggggccggc 


aatttttacc 


ttgggcattc 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


tgttcggggg 


tgcgataaac . 


ccagcgaacc 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


gtatgaaaac 


gagaattgga 


cctttacaga 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ctaccaagac 


gaagaggatg 


aagaggatga 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


tactgataag 


ataatatatc 


ttttatatag 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


ggcaaggcat 


aggcagcgcg 


cttatcaata 


tatctataga 


atgggcaaag 


cataaaaact 


3600 



tgcatggact aatgcttgaa acccaggaca 
attgggtaat gactccaact tattgatagt 
tgtcatgcag ctccaccgat tttgagaacg 
gctgcctcag attcaggtta tgccgctcaa 
gcagctttcc cttcaggcgg gattcataca 
cgtcaaaggg tgacagcagg ctcataagac 
atacgtgcgc aacaaccgtc ttccggagac 
gcgatttagc cccgacatag ccccactgtt 
tgcccggctg tatgcgcgag gttaccgact 
cgtgttgagg ccaacgccca taatgcgggc 
catatcaatg attttctggt gcgtaccggg 
ccatgtttta cggcagtgag agcagagata 
acgcaccacc ccgtcagtag ctgaacagga 
agcacctcaa aaacaccatc atacactaaa 
tggtttcaaa atcggctccg tcgatacta't 
aaaagctgtt ttctggtatt taaggtttta 
cttgttataa ttagcttctt ggggtatctt 
taaatggcta aaatgagaat atcaccggaa 
gtaaaagata cggaaggaab gtctcctgct 
aacctatatt taaaaatgac ggacagccgg 
gaaaaggaca tgatgctatg gctggaagga 
gaacggcatg atggctggag caatctgctc 
gaagagtatg aagatgaaca aagccctgaa 
aggctctttc, actccatcga catatcggat 
ttagccgaat tggattactt actgaataac 
gaagaagaca ctccatttaa agatccgcgc 
cccgaagagg aacttgtctt ttcccacggc 
gatggcaaag taagtggctt tattgatctt 
gacattgcct tctgcgtccg gtcgatcagg 
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ataaccttat agcttgtaaa ttctatcata 3660 
gttttatgtt cagataatgc ccgatgactt 3720 
acagcgactt ccgtcccagc cgtgccaggt 3780 
ttcgctgcgt atatcgcttg ctgattacgt 3840 
gcggccagcc atccgtcatc cabatcacca 3900 
gccccagcgt cgccatagtg cgttcaccga 3960 
tgtcatacgc gtaaaacagc cagcgctggc 4020 
cgtccatttc cgcgcagacg atgacgtcac 4080 
gcggcctgag ttttttaagt gacgtaaaat 4140 
tgttgcccgg catccaacgc cattcatggc 4200 
ttgagaagcg.gtgtaagtga actgcagttg 4260 
gcgctgatgt ccggcggtgc ttttgccgtt 4320 
gggacagctg atagacacag aagccactgg 4380 
tcagtaagtt ggcagcatca cccataattg 4440 
gttatacgcc aactttgaaa acaactttga 4500 
gaatgcaagg aacagtgaat tggagttcgt 4560 
taaatactgt agaaaagagg aaggaaataa 4620 
ttgaaaaaac tgatcgaaaa ataccgctgc 4680 
aaggtatata agctggtggg agaaaatgaa 4740 
tataaaggga ccacctatga tgtggaacgg 4800 
aagctgcctg ttccaaaggt cctgcacttt 4860 
atgagtgagg ccgatggcgt cctttgctcg 4920 
aagattatcg agctgtatgc- ggagtgcatc 4980 
tgtccctata cgaatagctt agaca.gccgc 5040 
gatctggccg atgtggattg cgaaaactgg 5100 
gagctgtatg attttttaaa gacggaaaag 5160 
gacctgggag acagcaacat ctttgtgaaa 5220 
g^gagaagcg gcagggcgga caagtggtat 5280 
gaggatatcg gggaagaaca gtatgtcgag 5340 
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ctattttttg acttactggg gatcaagcct gattgggaga aaataaaata ttatatttta 5400 
ctggatgaat tgttttagta cctagatgtg gcgcaacgat gccggcgaca agcaggagcg 5460 
caccgacttc ttccgcatca agtgttttgg ctctcaggcc gaggcccacg gcaagtattt 5520 
gggcaagggg tcgctggtat tcgtgcaggg caagattcgg aataccaagt acgagaagga 5580 
cggccagacg gtctacggga ccgacttcat tgccgataag gtggattatc tggacaccaa 5640 
ggcaccaggc gggtcaaatc aggaataagg gcacattgcc ccggcgtgag tcggggcaat 5700 
cccgcaagga gggtgaatga atcggacgtt tgaccggaag gcatacaggc aagaactgat 5760 
cgacgcgggg ttttccgccg aggatgccga aaccatcgca agccgcaccg tcatgcgtgc 5820 
gccccgcgaa accttccagt ccgtcggctc gatggtccag caagctacgg ccaagatcga 5880 
gcgcgacagc gtgcaactgg ctccccctgc cctgcccgcg ccatcggccg ccgtggagcg 5940 
ttcgcgtcgt ctcgaacagg aggcggcagg tttggcgaag . tcgatgacca tcgacacgcg 6000 
aggaactatg acgaccaaga- agcgaaaaac cgccggcgag gacctggcaa aacaggtcag 6060 
cgaggccaag caggccgcgt tgctgaaaca cacgaagcag cagatcaagg aaafcgcagct 6120 
ttccttgttc gatattgcgc cgtggccgga cacgatgcga gcgatgccaa acgacacggc 6180 
ccgctctgcc ctgttcacca cgcgcaacaa gaaaatcccg cgcgaggcgc tgcaaaacaa 6240 
ggtcattttc cacgtcaaca aggacgtgaa gatcacctac accggcgtcg agctgcgggc 6300 
cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 6360 
cgagccgatc accttcacgt • tctacgagct ttgccaggac ctgggctggt cgatcaatgg 6420 
ccggtattac acgaaggccg aggaatgcct gtcgcgccta caggcgacgg cgatgggctt 6480 
cacgtccgac cgcgttgggc acctggaatc ggtgtcgctg ctgcaccgct tccgcgtcct 6540 
ggaccgtggc aagaaaacgt cccgttgcca ggtcctgatc gacgaggaaa tcgtcgtgct 6600 
gtttgctggc gaccactaca cgaaattcat atgggagaag taccgcaagc tgtcgccgac 6660 
ggcccgacgg atgttcgact atttcagctc gcaccgggag ccgtacccgc tcaagctgga 6720 
aaccttccgc ctcatgtgcg gatcggattc cacccgcgtg aagaagtggc gcgagcaggt 6780 
cggcgaagcc tgcgaagagt tgcgaggcag cggcctggtg gaacacgcct gggtcaatga 6840 
tgacctggtg cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc 6900 
agccagcgct ttactggcat ttcaggaaca- agcgggcact gctcgacgca cttgcttcgc 6960 
tcagtatcgc tcgggacgca cggcgcgctc tacgaactgc cgataaacag aggattaaaa 7020 
ttgacaattg tgattaaggc tcagattcga cggcttggag cggccgacgt gcaggatttc 7080 
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cgcgagatcc 


gattgtcggc 


cctgaagaaa 


gctccagaga 


tgttcgggtc cgtttacgag 


7140 


cacgaggaga 


aaaagcccat ggaggcgttc 


gctgaacggt 


tgcgagatgc cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga gatcattggg 


ctgtcggtct 


tcaaacagga ggacggcccc 


7260 


aaggacgctc 


acaaggcgca 


tctgtccggc 


gttttcgtgg 


agcccgaaca gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt 


tattgctcgt gatgatcgtc 


7380 


cgacagattc 


caacgggaat 


ctggtggatg 


cgcatcttca 


tcctcggcgc acttaatatt 


7440 


tcgctattct 


ggagcttgtt gtttatttcg 


gtctaccgcc 


tgccgggcgg ggtcgcggcg 


7500 


acggtaggcg 


ctgtgcagcc gctgatggtc 


gtgttcatct 


ctgccgctct gctaggtagc 


7560 


ccgatacgat 


tgatggcggt cctgggggct 


atttgcggaa 


ctgcgggcgt ggcgctgttg 


7620 


gtgttgacac 


caaacgcagc gctagatcct 


gtcggcgtcg 


cagcgggcct ggcgggggcg 


7680 


gtttccatgg 


cgttcggaac 


cgtgctgacc 


cgcaagtggc 


aacctcccgt gcctctgctc 


7740 


acctttaccg 


cctggcaact ggcggccgga 


ggacttctgc 


tcgttccagt agctttagtg 


7800 


tttgatccgc 


caatcccgat gcctacagga 


accaatgttc 


tcggcctggc gtggctcggc 


7860 


ctgatcggag 


cgggtttaac "ctacttcctt 


tggttccggg 


ggatctcgcg' actcgaacct 


7920 


acagttgttt 


ccttactggg 


ctttctcagc 


cccagatctg 


gggtcgatca gccggggatg 


7980 


catcaggccg 


acagtcggaa 


cttcgggtcc 


ccgacctgta 


ccattcggtg agcaatggat 


8040 


aggggagttg 


atatcgtcaa 


cgttcacttc 


taaagaaata 


gcgccactca gcttcctcag 


8100 


cggctttatc 


cagcgatttc 


ctattatgtc 


ggcatagttc 


tcaagatcga cagcctgtca 


8160 


cggttaagcg 


agaaatgaat 


aagaaggctg 


ataattcgga 


tctctgcgag ggagatgata 


8220 


tttgatcaca 


ggcagcaacg 


ctctgtcatc 


gttacaatca 


acatgctacc ctccgcgaga 


8280 


tcatccgtgt 


ttcaaacccg 


gcagcttagt 


tgccgttctt 


ccgaatagca tcggtaacat 


8340 


gagcaaagtc 


tgccgcctta 


caacggctct 


cccgctgacg 


ccgtcccgga ctgatgggct 


8400 


gcctgtatcg 


agtggtgatt 


ttgtgccgag 


ctgccggtcg 


gggagctgtt ggctggctgg 


8460 


tggcaggata 


tattgt'ggtg 


taaacaaatt 


gacgcttaga 


caacttaata acacattgcg 


8520 


gacgttttta 


atgtacfcggg 


gtggtttttc 


ttttcaccag 


tgagacgggc aacagctgat 


8580 


tgcccttcac 


cgcctggccc 


tgagagagtt 


gcagcaagcg 


gtccacgctg gtttgcccca 


8640 


gcaggcgaaa 


atcctgtttg 


atggtggttc 


cgaaatcggc 


aaaatccctt ataaatcaaa 


8700 


agaatagccc 


gagatagggt 


tgagtgttgt 


tccagtttgg 


aacaagagtc cactattaaa 


8760 


gaacgtggac 


tccaacgtca 


aagggcgaaa 


aaccgtctat 


cagggcgatg gcccactacg 


8820 
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tgaaccatca 


cccaaatcaa 


gttttttggg 


gtcgaggtgc 


cgtaaagcac 


taaatcggaa 


8880 


ccctaaaggg 


agcccccgat 


ttagagcttg 


acggggaaag 


ccggcgaacg 


tggcgagaaa 


8940 


ggaagggaag 


aaagcgaaag 


gagcgggcgc 


cattcaggct 


gcgcaactgt 


tggg'aagggc 


9000 


gatcggtgcg 


ggcctctfccg 


ctattacgcc 


agctggcgaa 


agggggatgt 


gctgcaagge 


9060 


gattaagttg 


ggtaacgcca 


ggg-ttttccc 


agtcacgacg 


ttgtaaaacg 


acggccagtg 


9120 


aattaattcc 


catcttgaaa 


gaaataltagt 


■ttaaatattt 


attgataaaa 


taacaagtca 


9180 


ggtattatag 


tccaagcaaa 


aacabaaatt 


tattgatgca 


agtttaaatt 


cagaaatatt 


9240 


tcciataactg 


attatatcag 


ctggtacatt 


gccgtagatg 


aaagactgag 


tgcgatatta 


9300 


tgtgtaatac 


ataaattgat 


gatatagcta 


get cage tea 


tegggggatc 


cgtcgaagct 


9360. 


agcttgggtc 


ccgctcagaa 


gaactcgtca 


agaaggcgat 


agaaggegat 


gcgetgegaa 


9420 


tcgggagcgg 


cgataccgta 


aagcacgagg 


aagcggtcag 


cccattcgcc 


gccaagctct 


9480 


tcagcaatat 


cacgggtagc 


caacgctatg 


tcctgatagc 


ggtccgccac 


acccagcegg 


9540 


ccacagtcga 


tgaatccaga 


aaagcggcca 


ttttc caeca 


tgatattcgg 


caagcaggca 


9600 


tcgccatggg 


tcacgacgag 


atcctcgccg 


tcgggcatgc 


gegcettgag 


cctggcgaac 


9660 


agttcggctg 


gcgcgagccc 


ctgatgctct 


tegtccagat 


eatcctgatc 


gacaagaccg 


9720 


gcttccatcc 


gagtacgtgc 


tcgctcgatg 


cgatgtttcg 


cttggtggtc 


gaatgggcag 


9780 


gtagccggat 


caagcgtatg 


cagccgccgc 


attgcatcag 


ccatgatgga 


tactttctcg 


9840 


gcaggagcaa 


ggtgagatga 


caggagatcc 


tgccccggca 


cttcgcccaa 


tagcagccag 


9900 


tcccttcccg 


cttcagtgac 


aacgtcgagc 


acagctgcgc 


aaggaacgcc 


cgtcgtggcc 


9960' 


agccacgata . 


gccgcgctgc 


ctcgtcctgc 


agttcattca 


gggcacegga 


caggtcggtc 


10020 


ttgacaaaaa 


gaaccgggcg 


cccctgcgct 


gacagccgga 


aeacggegge 


atcagagcag 


10080 


ccgattgtct 


gttgtgccca 


gtcatagccg 


aatagcctct 


ccacccaagc 


ggccggagaa 


10140 


cctgcgtgca 


atccatcttg 


ttcaatccaa 


gctcccatgg 


gccctcgact 


agagtcgaga 


10200 


tctggattga 


gagtgaatat 


gagactctaa 


ttggataccg 


aggggaattt 


atggaaegtc 


10260 


agtggagcat 


ttttgacaag 


aaatatttgc 


tagctgatag 


tgaccttagg 


cgacttttga 


10.320 


acgcgcaata 


atggtttctg 


acgtatgtgc 


ttagctcatt 


aaactccaga 


aacccgcggc 


10380 


tgagtggctc 


cttcaacgtt 


gcggttctgt 


cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


10440 


gtcatcggcg 


ggggtcataa 


cgtgactccc 


ttaattctcc 


get cat gate 


ttgataccct 


10500 


gcgccatcag 


atccttggcg 


gcaagaaagc 


catccagttt 


actttgcagg 


gcttcccaac 


10560 
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cttaccagag 


ggcgccccag 


ctggcaattc 


cggttcgctt 


-gctgtccata 


aaaccgccca 


10620 


gtctagctat 


cgccatgtaa 


gcccactgca 


agctacctgc 


tttctctttg 


cgcttgcgtt 


10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca' 


10800 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aacgtctaaa 


cccttgtaat 


ttgtttttgt 


tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gataaatttt 


tatatttggt 


ac'taaattta 


taacaccttt 


tatgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta 


aatatttgct 


aatatttcta 


ctataggaga 


11100 


attaaagtga 


gtgaatatgg 


taccacaagg 


tttggagatt 


taattgttgc 


aatgctgcat 


11160 


ggatggcata 


tacaccaaac 


attcaataat 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


tttgaggtgc 


atgaacgtca 


cgtggacaaa 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat 


ggatgccctg 


tggaaagttt 


aaaaatattt 


11340 


tggaaatgat 


ttgcatggaa 


gccatgtgta 


aaaccatgac 


atccacttgg 


aggatgcaat 


11400 


aatgaagaaa 


actacaaatt 


tacatgcaac 


tagttatgca 


tgtagtctat. 


ataatgagga 


11460 


ttttgcaata 


ctttcattca 


t^cacactca 


ctaagtttta 


cacgattata 


atttcttcat 


11520 


agccagccca 


ccgcggtggg 


cggccgcctg 


cagtctagaa 


ggcctcctgc 


tttaatgaga 


11580 


tatgcgagac 


gcc tat gate 


gcatgatatt 


tgctttcaat 


tctgttgtgc 


acgttgtaaCaL 


11640 


aaacctgagc 


atgtgtagct 


cagatcctta 


dcgccggttt- 


cggttcattc 


taatgaatat 


11700 


atcacccgtt 


actatcgtat 


ttttatgaat 


aatattctcc 


gttcaattta 


ctgattgtcc 


11760 


gtcgagcaaa 


tttacacatt 


gccactaaac 


gtctaaaccc 


ttgtaatttg 


tttttgtttt 


11820 


actatgtgtg 


ttatgtattt 


gatttgcgat 


aaatttttat 


atttggtact 


aaatttataa 


11880 


caccttttat 


gctaacgttt 


gccaacactt 


agcaatttgc 


aagttgatta 


attgattcta 


11940 


aattattttt 


gtcttctaaa 


tacatatact 


aatcaactgg 


aaatgtaaat 


atttgctaat 


12000 


atttctacta 


taggagaatt 


aaagtgagtg 


aatatggtac 


cacaaggttt 


ggagatttaa 


12060 


ttgttgcaat 


gctgcatgga 


tggcatatac 


accaaacatt 


caataattct 


tgaggataat 


12120 


aatggtacca 


cacaagattt 


gaggtgcatg 


aacgtcacgt 


ggacaaaagg 


tttagtaatt 


12180 


tttcaagaca 


acaatgttac 


cacacacaag 


ttttgaggtg 


catgcatgga 


tgccctgtgg 


12240 


aaagtttaaa 


aatattttgg 


aaatgatttg 


catggaagcc 


atgtgtaaaa 


ccatgacatc 


12300 



cacttggagg 


atgcaataat 
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gaagaaaact acaaatttac 


atgcaactag ttatgcatgt 


12360 


agtctatata 


atgaggattt 


tgcaatactt tcattcatac 


acactcacta agttttacac 


12420 


gattataatt 


tcttcatagc 


cagcggatcc gatatcgggc 


ccgctagcgt taaccctgct 


12480 


ttaatgagat 


atgcgagacg 


cctatgatcg catgatattt 


gctttcaatt ctgttgtgca 


12540 


cgttgtaaaa 


aacctgagca 


tgtgtagctc agatccttac 


cgccggtttc ggttcattct 


12600 


aatgaatata 


tcacccgtta. 


ctatcgtafct tttatgaata 


atattctccg ttceiatttac 


12660 


tgattgtccg 


tcgacgaatt 


cgagctcggc gcgcctctag 


aggatcgatg aattcagatc 


12720 


ggctgagtgg 


ctccttcaac. 


gttgcggttc tgtcagttcc 


aaacgtaaaa cggcttgtcc 


12780 


cgcgtcatcg 


gcgggggtca 


taacgtgact cccttaattc 


tccgctcatg atcagattgt 


12840 


cgtttcccgc 


cttcagttta 


aactatcagt gtttgacagg 


atatattggc gggtaaacct 


12900 


aagagaaaag 


agcgtttatt 


agaataatcg gatatttaaa 


agggcgtgaa aaggtttatc 


12960 


cttcgtccat 


ttgtatgtgc 


atgccaacca cagggttccc 


ca 


13002 
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gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 
gcgcccagca caggtgcgca ggcaaattgc. accaacgcat acagcgccag cagaatgcca 120 
tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg cagcaccggc 180 
ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac gatcaggggt 240 
atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg aacgcgcgga 300 
ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa gtgtcaagca 360 
tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg aacgaggtcg 420 
gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag cagccggcgc 480 
tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa gccatgctgg 540 
cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca tttctgatcg 600 
ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg cgcatccatg 660 
ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt cgcttcctct 720 



gcgaggcggg tttttcggcc ggggacgccg 
ctgttggggc cgtgcttgag gagcaggccg 
ccgttgaaca ggctccgctc tcgccgctgt 
ccggtccgga cgcagcgttc gagcagggac 
ggaggctcgt tgtcaggaac gttgaaggac 
tgccggagcg caacccactc actacagcag 
ccaccgcgtc agacgcccgt agcagcccgc 
ccaagcctca cggccgcgct cggcctctct 
gctcactgac tcgctgcgct cggtcgttcg 
ggcggtaata cggttatcca cagaatcagg 
aggccagcaa aaggccagga accgtaaaaa 
ccgcccccct gacgagcatc acaaaaatcg 
aggactataa agataccagg cgtttccccc 
gaccctgccg cttaccggat acctgtccgc 
ccgctgcata accctgcttc ggggtcatta 
tcgcacgata tacaggattt tgccaaaggg 
ggcgtcagcc gggcaggata ggtgaagtag 
ctgtccctta ttcgcacctg gcggtgctca 
ctaccgccgg cgtaacagat gagggcaagc 
agggcagccc acctatcaag gtgtactgcc 
aggcggcggc ggccggcatg agcctgtcgg 
aaatcacggg cgtcgtggac tatgagcacg 
tgggccgcct gggcggcctg ctgaaactct 
tcggtgatgc cacgatcctc gccctgctgg 
gcaaggtcat gatgggcgtg gtccgcccga 
aacggccggg gggtgcgcgt gattgccaag 
gacttcgcgg agctggtgaa gtacatcacc 
gacgctcacc gggctggttg ccctcgccgc 
cgcgccagaa acgccgtcga agccgtgtgc 
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tcaatgcgct gatgacaatc age tact tea 780 
gcgacagcga tgccggcgag cgcggcggca 840 
tgcgggccgc gatagacgcc .ttcgacgaag 900 
tcgcggtgat tgtcgafcgga ttggcgaaaa 9 SO 
cgagaaaggg tgacgattga tcaggaccgc 1020 
agccatgtag acaacatccc ctcccccttt 1080 
tacgggcttt ttcatgccct gccctagcgt 1140 
ggcggccttc tggcgctctt ccgcttcctc 1200 
gctgcggcga gcggtatcag ctcactcaaa 1260 
ggataacgca ggaaagaaca tgtgagcaaa 1320 
ggccgcgttg ctggcgtttt Iccataggct 1380 
acgctcaagt cagaggtggc gaaacccgac 1440 
tggaagctcc ctcgtgcgct ctcctgttcc 1500 
ctttctccct tcgggaagcg tggcgctttt 1560 
tagcgatttt ttcggtatat ccatcctttt 1620 
ttcgtgtaga ctttccttgg tgtatccaac 1680 
gcccacccgc gagcgggtgt tccttcttca 1740 
acgggaatcc. tgctctgcga ggctggccgg 1800 
ggatggctga tgaaaccaag ccaaccagga 1860 
ttccagacga acgaagagcg attgaggaaa 1920 
cctacctgct ggccgtcggc cagggctaca 1980 
tccgcgagct ggcccgcatc aatggcgacc 2040 
ggctcaccga cgacccgcgc acggcgcggt 2100 
cgaagatcga agagaagcag gacgagcttg 2160 
gggcagagcc atgacttttt tagccgctaa 2220 
cacgtcccca tgcgctccat caagaagagc 2280 
gacgagcaag gcaagaccga gcgcctttgc .2340 
tgggctggcg gccgtctatg gccctgcaaa 2400 
gagacaccgc ggccgccggc gttgtggata 2460 
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cctcgcggaa 


aacttggccc 


tcactgacag 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


cgactcaccc 


ggcgcggcgt 


tgacagatga 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa 


cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gatgtggaca 


agcctgggga 


taagtgccct 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgacagatga 


ggggcgcgat 


ccttgacact 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


gcacctattg 


acatttgagg 


ggctgtccac 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


ccgcccgttt 


ttcggccacc 


gctaacctgt 


cttttaacct 


gcttttaaac 


caatatttat 


2880 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


tgccccccct 


tctcgaaccc 


tcccggcccg 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


tgcgcccctc 


ggccgcgaac 


ggcctcaccc 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


ttgccgggat 


caaacrcaa'ta 


acggoratcrgcr 


cgatcagccc 


gagcgcgacg 


cccgg^agca 


3120 


ttgacgtgcc 


crcacrcrtQcta 


gcatcgacat 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


31'80 


crccrcr cc t0crG 


t dcf c crcrc c t CT 

V- y y v- y y V- v.- «- 


cccttcactt 


ccrg cc cr t c era 


ggcattcacg 


gacttcatgg 


3240 


ccracrcrc ccrcrc 


aatt^^tacc 


ttgggcattc 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


tattcgcrwcf 


tgcga^aaac 


ccagcgaacc 


atttgaggto 


ataggtaaga 


ttataccgag 


3360 


gtatgaaaac 


gagaattgga 


cctttacaga 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ctaccaagac 


gaagaggatg 


aagaggatga 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


tactgataag 


ataatatatc 


ttttatatag 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


ggcaaggcat 


agacaacCTcg 


cttatcaata 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


tgcatggact 


aatgcttgaa 


acccaggaca 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


tattgatagt 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


ac^gcgactt 


ccgtcccagc 


cgtgccaggt 


3780 


gc tgcctcag 


attcaggtta 


tgccgctcaa 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttcc 


cttcaggcgg 


gattcataca 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 


cgtcaaaggg 


tgacagcagg 


ctcataagac 


gccccagcgt 


cgccatagtg 


cgt fccaccga 


3960 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


gcgatttagc 


cccgacatag 


ccccactgtt 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


tgcccggctg 


tatgcgcgag 


gttaccgact 


gcggcctgag 


ttttttaagt 


gacgtaaaat 


4140 


cgtgttgagg 


ccaacgccca 


taatgcgggc 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 
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catatcaatg attttctggt 


gcgtaccggg 


ccatgtttta cggcagtgag 


agcagagata 


acgcaccacc 


ccgtcagtag 


ctgaacagga 


agcacctcaa aeiacaccatc 


a^ac ac t aaa 


tggtttcaaa 


.atcggctccg 


tcgatactat 


aaaagctgtt . 


ttctggtatt 


taaggtttta 


cttgttataa 


ttagcttctt 


oaaatatctt 


taaatggcta 


aaafcgagaat 


atcaccggaa 


gtaaaagata 


cggaaggaat . 


gtctcctgct 


aacctatatt 


taaaaatgac 


crcracacrcccrcr 


gaaaaggaca 


tgatgctatg 


crctcrgaaorcra 


gaacggcatg 


atggctggag 


caatctgctc 


gaagagtatg 


aagatgaaca 


aagc c c tgaa 


aggctctttc 


actccatcga 


catatcggab 


ttagccgaat 


tggattactt 


actgaataac 


gaagaagaca 


ctccatttaa 


aga t c cgcgc 


cccgaagagg 


aacttgtctt 


tticccacggc 


gatggcaaag 


taagtggctt 


tattgatctt 


gacattgcct 


tctgcgtccg 


alicaaticaaa 


ctattttttg 


acttactggg 


gatcaagcct 


c t crcra t craa t 


tgttt'tagta 


cctagatigtg 


caccgacttc 


ttccgcatca 


agtgttttgg 


gggcaagggg 


tcgctggtat 


tcgtgcaggg 


cggccagacg 


gtctacggga 


ccgacttcat 


ggcaccaggc 


gggtcaaatc 


aggaataagg 


cccgcaagga 


gggtgaatga 


atcggacgtt 


cgacgcgggg 


ttttccgccg 


aggatgccga 


gccccgcgaa 


accttccagt 


ccgtcggctc 


gcgcgacagc 


gtgcaactgg 


ctccccctgc 



ttgagaagcg 


gtgtaagtga 


actgcagttg 4260 


gcgctgatgt 


ccggcggtgc 


ttttgccgtt 


4320 


gggacagctg 


atagacacag 


aagccactgg 4380 


tcagtaagtt 


ggcagcatca 


cccataattg 4440 


gttatacgcc 


aacttt'gaaa 


acaactttga 


'4500 


gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 


ta^abactgt 


agaaaagagg 


aaggaaataa 


4620 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4680 


aaggtatata 


agctggtggg 


agaaaatgaa 


4740 


tataaaggga 


bcacctatga 


tgtggaacgg 


4800 


aagctgcctg 


ttccaaaggt 


cctgcacttt 


4860 


atgagtgagg 


ccgatggcgt 


cctttgctcg 


4920 


aagattatcg 


agctgtatgc 


ggagtgcatc 


4980 


tgtqcctata 


cgaatagctt 


agacagccgc 


5040 


gatctggccg 


atgtggattg 


cgaaaactgg 


5100 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


gacctgggag 


acagcaacat 


ctttgtgaaa 


5220 


gggagaagcg 


gcagggcgga 


caagtggtat 


5280 


gaggatatcg 


ggga:agaaca 


gtatgtcgag 


5340 


gattgggaga 


aaataaaata 


ttatatttta 


5400 


gcgcaacgat 


gccggcgaca 


agcaggagcg 


5460 


ctctcaggcc 


gaggcccacg 


gcaagtattt 


5520 


caagattcgg 


aataccaagt 


acgagaagga 


5580 


tgccgataag 


gtggattatc 


tggacaccaa 


5640 


gcacaucgcc 


ccggcgtgag 


tcggggcaat 


5700 


tgaccggaag 


gcatacaggc 


aagaactgat 


5760 


aaccatcgca 


agccgcaccg 


tcatgcgtgc 


5820 


gatggtccag 


caagctacgg 


ccaagatcga 


5880 


cctgcccgcg 


ccatcggccg 


ccgtggagcg 


5940 
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ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


tttggcgaag 


tcgatgacca 


tcgacacgcg 


6000 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag 


gacctggcaa 


aacaggtcag 


6060 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cacgaagcag 


cagatcaagg 


aaatgcagct 


6120 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 


6180 


ccgctctgcc 


ctgttcacca 


cgcgcaacaa 


gaaaatcccg 


cgcgaggcgc 


tgcaaaacaa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


accggcgtcg 


agctgcgggc 


6300 


cgacgatgac 


gaactggtgt 


ggcagcaggt 


gttggagtac 


gcgaagcgca 


cccctatcgg 


6360" 


cgagccgatc 


accttcacgt 


tctacgagct 


ttgccaggac 


ctgggctggt 


cgatcaatgg 


6420 


ccggtattac 


acgaaggccg 


aggaatgcct 


gtcgcgccta 


caggcgacgg 


cgatgggctt 


6480 


cacgtccgac 


cgcgttgggc 


acctggaatc 


ggtgtcgctg 


ctgcaccgct 


tccgcgtcct 


6540 


ggaccgtggc 


aagaaaacgt 


cccgttgc.ca 


ggtcctgatc 


gacgaggaaa 


tcgtcgtgcf 


6600 


gtttgctggc 


gaccactaca 


cgaaattcat 


atgggagaag 


taccgcaagc 


tgtcgccgac 


6660 


ggcccgacgg 


atgttcgact 


atttcagctc 


gcaccgggag 


ccgtacccgc 


tcaagctgga 


6720 


aaccttccgc 


ctcatgtgcg 


gatcggattc 


cacccgcgtg 


aagaagtggc 


gcgagcaggt 


6780 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


cggcctggtg 


gaacacgcct 


gggtcaatga 


6840 


tgacctggtg 


cattgcaaac 


gctagggcct 


tgtggggtca 


gttccggctg 


ggggttcagc 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca 


agcgggcact 


gctcgacgca 


cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


tacgaactgc 


cgataaacag 


aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggcttggag 


cggccgacgt 


gcaggatttc 


7080 


cgcgagatcc 


gattgtcggc 


cctgaagaaa 


gctccagaga 


tgttcgggtc 


cgtttacgag 


7140 


cacgaggaga 


aaaagcGcat 


ggaggcgttc 


gctgaacggt 


tgcgagatgc 


cgtggcattc 


7200 


ggcgcct.aca 


tcgacggcga 


gatcattggg 


ctgtcggtct 


tcaaacagga. 


ggacggcccc 


7260 


aaggacgctc 


acaaggcgca 


tctgtccggc 


gttttcgtgg 


agcccgaaca 


gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt 


tattgctcgt 


gatgatcgtc 


7380 


cgacagat tc 


caacgggaat 


c t GTG ticrcraticr 

^ fc-yy tfcty 


cgcatct tea 


tec tcggcgc 


acttaatatt 


7440 


tcgctattct 


ggagcttgtt 


gtttatttcg 


gtctaccgcc 


tgccgggcgg 


ggtcgcggcg 


7500 


acggtaggcg 


ctgtgcagcc 


gctgatggtc 


gtgttcatct 


ctgccgctct 


gctaggtagc 


7560 


ccgatacgat 


tgatggcggt 


cctgggggct 


atttgcggaa 


ctgcgggcgt 


ggcgctgttg 


7620 


gtgttgacac 


caaacgcagc 


gctagatcct 


gtcggcgtcg 


cagcgggcct 


ggcgggggcg 


7680 



gtttccatgg cgttcggaac cgtgctgacc 
acctttaccg cctggcaact ggcggccgga 
tttgatccgc caatcccgat gcctacagga 
ctgatcggag cgggtttaac ctacttcctt 
acagttgttt ccttactggg ctttctcagc 
catcaggccg acagtcggaa cttcgggtcc 
aggggagttg atatcgtcaa cgttcacttc 
cggctttatc cagcgafettc ctattatgtc 
cggttaagcg agaaatgaat aagaaggctg 
thtgatcaca ggcagcaacg. ctctgtcatc 
tcatccgtgt ttcaaacccg gcagcttagt 
gagcaaagtc tgccgcctta caacggctct 
gcctgtatcg agtggtgatt ttgtgccgag 
tggcaggata tattgtggtg taaacaaatt 
gacgttttta atgtactggg gtggtttttc 
tgcccttcac cgcctggccc tgagagagtt 
gcaggcgaaa atcctgtttg at'ggtggttc 
agaatagccc gagatagggt tgagtgttgt 
gaacgtggac tccaacgtca aagggcgaaa 
tgaaccatca cccaaatcaa gttttttggg 
ccctaaaggg agcccccgat ttagagcttg 
ggaagggaag aeiagcgaaag gagcgggcgc 
gatcggtgcg ggcctcttcg ctattacgcc 
gattaagttg ggtaacgcca gggttttccc 
aattaattcc catcttgaaa gaaatatagt 
ggtattatag tccaagcaaa aacataaatt 
tcaataactg attatatcag ctggtacatt 
tgtgtaatac ataaattgat gatatagcta 
agcttgggtc ccgctcagaa gaactcgtca 
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cgcaagtggc aacctcccgt gcctctgctc 7740 
ggacttctgc tcgttccagt agctttagtg 7800 
accaatgttc tcggcctggc gtggctcggc 7860 
tggtbccgggggatctcgcg actcgaacct 7920* 
cccagatctg gggtcgatca gccggggatg 7980 
ccgacctgta ccattcggtg agcaatggat 8040 
taaagaaata gcgccactca gcttcctcag 8100 
ggcatagfctc tcaagatcga cagcctgtca 8160 
ataattcgga tctctgcgag ggagatgata 8220 
gttacaatca acatgct'acc ctccgcgaga 8280 
tgccgttctt ccgaatagca tcggtaacat 8340 
cccgctgacg ccgtcccgga ctgatgggct 8400 
ctgccggtcg gggagctgtt ggctggctgg 8460 
gacgcttaga caacttaata acacattgcg 8520 
ttttcaccag tgagacgggc aacagctgat 8580 
gcagcaagcg gtccacgctg gtttgcccca 8640 
cgaaatcggc aaaatccctt ataaatcaaa 8700 
tccagtttgg aacaagagtc cactattaaa 8760 
aaccgtctat cagggcgatg gcccactacg 8820 
gtcgaggtgc cgtaaagcac taaatcggaa 8880 
acggggaaag ccggcgaacg tggcgagaaa 8940 
cattcaggct gcgcaactgt tgggaagggc 9000 
agctggcgaa agggggatgt gctgcaaggc 9060 
agtcacgacg ttgtaaaacg acggccagtg 9120 
ttaaatattt attgataaaa taacaagtca 9180 
tattgatgca agtttaaatt cagaaatatt 9240 
gccgtagatg aaagactgag tgcgatatta 9300 
gcttagctca tcgggggatc cgtcgaagct 9360 
agaaggcgat agaaggcgat gcgctgcgaa 9420 
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tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc gccaagctct 9480 
tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 
ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccfctgag cctggcgaac 9660 
agttcggctg gcgcgagccc ctgatgctct - tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 
agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa gctcccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgfc cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 
cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaacc^ccca 10620 
gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
ttcccttgtc cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagcccttg cgccctgagt gcttgcggca 10800 
gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat actaatcaac tggaaatgta ciatatttgct aatatttcta ctataggaga 11100 
attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
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ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta ccacacaaga 11220 
tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 
tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 
aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 
agccagccca ccgcggtggg cggccgcctg cagtctagaa ggcctcctgc tttaatgaga 11580 
tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 11640 
aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 11700 
atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta ctgattgtcc 11760 
gtcgagcaaa tttacacatt gccactaaac gtctaaaccc ttgtaatttg tttttgtttt 11820 
actatgtgtg ttatgtattt gatttgcgat aaatttttat atttggtact aaatttataa 11880 
caccttttat gctaacgttt gccaacactt agcaatttgc aagttgatta attgattcta 11940 
aattattttt gtcttctaaa tacatatact aatcaactgg aaatgtaaat atttgctaat 12000 
atttctacta taggagaatt aaagtgagtg aatatggtac cacaaggttt ggagatttaa- 12060 
ttgttgcaat gctgcatgga tggcatatac accaaacatt caataattct tgaggataat 12120 
aatggtacca cacaagattt gaggtgcatg aacgtcacgt ggacaaaagg tttagtaatt 12180 
tttcaagaca acaatgttac cacacacaag ttttgaggtg catgcatgga tgccctgtgg 12240 
aaagtttaaa aatattttgg aaatgatttg catggaagcc atgtgtaaaa ccatgacatc 12300 
cacttggagg atgcaataat gaagaaaact acaaatttac atgcaactag ttatgcatgt 12360 
agtctatata atgaggattt tgcaatactt* tcattcatac acactcacta agttttacac 12420 
gattataatt tcttcatagc cagcggatcc gatatcgggc ccgctagcgt taaccctgct 12480 
ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca 12540 
cgttgtaaaa aacctgagca tgtgtagctc agatccttac cgccggtttc ggttcattct 12600 
aiatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaatttac 12660 
tgattgtccg tcgagcaaat ttacacattg ccactaaacg tctaaaccct tgtaatttgt 12720 
ttttgtttta ctatgtgtgt tatgtatttg atttgcgata aatttttata tttggtacta 12780 
aatttataac accttttatg ctaacgtttg ccaafcactta gcaiatttgca agttgattaa 12840 
ttgattctaa attatttttg tcttctaaat acatatacta atcaactgga aatgtaaata 12900 
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13320 


rft" ^♦•ar'a/^rf 

^ U U UC&l.«Cl^^ 


at"i"at'aai"t'fc 


^ I. W%*Ol L>Ci^ 


acTfaoa t Gh cr 
Ay ^Giy A ^ s« I* y 


c ccf crc a t Gcra 

w v*y y Wwy « 


tcccgggcca 


13380 




1" A A H rf a rra ^ a 


1" rrrrra rta n err* 


sk i«6i ii#y m« ^y V 


atcratatfctcr 


ctttcaattc 


13440* 




i?r4* t* a aa a A 
y u itfCbdCLCia 


ai^r*f"rra^Tr»a h 


y i#y i^Giy ^ u^gl 


rrateettaec 


gccggtttcg 


13500 






f-ia r*r*r*rrt~i~ar* 




t tatcraa taa 

L» iaCL t^y fao ^»CLg 


tattctccgt 


13560 






4^ /*f a rra rr*^ h o 
v^y as,ry ciy u ^ 




i~ a rra rriTa ir" rr 
^ciy cLyy CL L*wy 


atgaattcag 


13620 


atcggctgag 


tggctccttc 


aacgttgcgg 


ttctgtcagt 


tccaaacgta 


aaacggcttg 


13680 


tcccgcgtca 


tcggcggggg 


tcataacgtg 


actcccttaa 


ttctccgctc 


atgatcagat 


13740 


tgtcgtttcc 


cgccttcagt 


ttaaactatc 


agtgtttgac 


aggatatatt 


ggcgggtaaa 13800 


cctaagagaa 


aagagcgttt 


attagaataa 


tcggatattt 


aaaagggcgt 


gaaaaggttt 


13860 


atccttcgtc 


catttgtatg 


tgcatgccaa 


ccacagggtt 


cccca 




13905 



<210> 25 
<211> 15430 
<212> DNA 
<213> Unknown 

<220> 

<223> pflan2. Express! onsvektor itiit zwei Promotor- 
Terminator-Expressionskassetten inseriert ist 
Physcoiciitrella patens Elongase mid Desaturase 

<220> 
<221> CDS 

.<222> (11543) . . (12415) 

<220> 
<221> CDS 

<222> (13313) . . (14890) 
<400> 25 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 



gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca. 120 
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tgacgtcgtt 


cgagtgaacc 


ataatcaggc 


cgatgccgac 


agcgtcgagc 


a tcrt t crcrcT 1 1 


tcacgtctgg 


cctccggacc 


ttctittiatca 


ctcrataacrtt 


ggtggacata 


t oac aaao 1 1 


crc acrcccraa t 


acagtgatcc 


acat. acraccrcr 


tctaacaaca 


cgcaaactgg 


tttactcroca 


cttcacrcraac 


aaacooacac 




haccrcattccf 


atcrcccraaacr 




e acre 1 1 c aero 

s«ay ^ w w wwy y 


cacrcrcGc tcrc 

w **y y w>jw w^ w 


1^ fierce caf CTGcr 


ac coactccTC a 

GLw vy yy wy w^ 


' cccTcacratcrcr 
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^(_>y v« i^^cLv^^^d 


crcTCf' cccrctc 

\^ ^ w ^ 


t cgccgc tgt 


v*wyy wwwy yA 


s»y waywy www 


%fcj3 %*^3 ^3 


y y wy y n* i^wy w 


t CT tc acTcraac 

W^ WW j **^* w 


a t tiaaaacrac 


tcrccocracrecr 

i»y ^wyy 


caacccactic 


ac tacagcag 


WtfCkwwy v^y 


acraecrccccrt 

viy Wwy wwwy w 


acrcacrcc cere 


r'paacrr'nt" ca 


^»yywwyv^yww 


cggcctcfcct 


CTP t c a(^ fccrar! 


w^y Vn- wy *i^y w w 


c cro" t c cr t tc Cf 


crcr G crcr t aa ta 
y y '•^y y www 


ccrat t atcca 

w*g y w w cfc Www Oh 


c acraa t cacrcr 


acrcrcGacrc aa 


any y w v»a>y y o 


accgtaaaaa 


ccaccccccit. 

wW^w wwW>»>^ W 


craccracrc! ate 


acaaaaat eg 


acrcrac t a t aa 


agataccagg 


cgtttccccc 


cfaccc tgccg 


cttaccggat 


acctgtccgc 


ccgctgcata 


accctgcttc 


ggggtcatta 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


ctaccgccgg 


cgtaacagat 


gagggcaagc 



agatcgcgca 


ggaggcccgg cagcaccggc 


180 


gcgacagtgc 


tcagaattac gatcaggggt 


240 


age ct cage t 


ggtccgattg aacgcgcgga 


300 


ttatgtttat 


eagtgataaa gtgtcaagca 


360 


gtgccgccct 


ggacctgttg aacgaggtcg 


420 


cggaacggtt 


gggggttcag cagccggcgc 


480 


tgctcgacgc 


actggecgaa gccatgctgg 


540 


ccgacgacga 


ctggcgctca tttctgatcg 


600 


tcgcctaceg 


cgatggcgcg cgcatccatg 


660 


aaacggccga 


cgcgcagctt cgcttcctct 


720 


tcaatgcgct 


gatgacaatc age tact tea 


780 


gcgacagcga 


tgccggcgag cgcggcggca 


840 


tgcgggccgc 


gatagacgcc ttcgacgaag 


900 


tcgcggtgat 


tgtcgatgga ttggcgaaaa 


960 


cgagaaaggg 


tgacgattga tcaggacegc 


1020 


agccatgtag 


acaacatccc etcccccttt 


1080 


tacgggcttt 


ttcatgcect gccctagcgt 


1140 


ggcggccttc 


tggcgctctt ccgcttcctc 


1200 


gctgcggega 


gcggtatcag ctcactcaaa 


1260 


ggataacgca 


ggaaagaaea tgtgageaaa 


1320 


ggccgcgttg 


ctggcgtttt tccataggct 


1380 


acgctcaagt 


cagaggtggc gaaacccgac 


1440 


tggaagctcc 


ctcgtgcgct ctcctgttcc 


1500 


ctttctccct 


tcgggaagcg tggcgctttt 


1560 


tagcgaccEC 


ttcggcauat ccaccccccc 




ttcgtgtaga 


ctttccttgg tgtatceaac 


1680 


gcccacccgc 


gagcgggtgt tccttcttea 


1740 


acgggaatcc 


tgctctgcga ggctggccgg 


1800 


ggatggctga 


tgaaaccaag ccaaccagga 


1860 
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agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg attgaggaaa 1920 
aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc cagggctaca 1980 
aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc aatggcgacc 2040 
tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc acggcgcggt 2100 
tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag gacgagcttg 2160 
gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc - atgacttttt tagccgctaa 2220 
aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat caagaagagc 2280 
gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga gcgcctttgc 2340 
gacgctcacc gggctggttg ccctcgccgc tgggctggcg gccgtctatg gccctgcaaa 2400 
cgcgccagaa acgccgtcga agccgtgtgc gagacaccgc ggccgccggc gttgtggata 2460 
cctcgcggaa aacttggccc tcactgacag atgaggggcg gacgiitgaca cttgaggggc 2520 
cgactcaccc ggcgcggcgt tgacagatga ggggcaggct cgatttcggc cggcgacgtg 2580 
gagctggcca gcctcgcaaa tcggcgaaaa cgcctgattt tacgcgagtt tcccacagat 2640 
gatgtggaca agcctgggga taagtgccct gcggtattga cacttgaggg gcgcgactac 2700 
tgacagatga ggggcgcgat ccttgacact tgaggggcag agtgctgaca gatgaggggc 2760 
gcacctattg acatttgagg ggctgtccac aggcagaaaa tccagcattt gcaagggttt 2820 
ccgcccgttt ttcggccacc gctaacctgt cttttaacct gcttttaaac caatatttat 2880 
aaaccttgtt tttaaccagg gctgcgccct gtgcgcgtga ccgcgcacgc cgaagggggg 2940 
.tgccccccct tctcgaaccc tcccggcccg ctaacgcggg cctcccatcc ccccaggggc 3000 
tgcgcccctc ggccgcgaac ggcctcaccc caaaaatggc agcgctggca gtccttgcca 3060 
ttgccgggat cggggcagta acgggatggg cgatcagccc gagcgcgacg cccggaagca 3120 
-ttgacgtgcc gcaggtgctg gcatcgacat' tcagcgacca ggtgccgggc agtgagggcg 3180 
gcggcctggg tggcggcctg cccttcactt cggccgtcgg ggcattcacg gacttcatgg 3240 
cggggccggc aatttttacc ttgggcattc ttggcatagt ggtcgcgggt gccgtgctcg 3300 
tgttcggggg tgcgatciaac ccagcgaacc atttgaggtg ataggtaaga ttataccgag 3360 
gtatgaaaac gagaattgga cctttacaga attactctat gaagcgccat atttaaaaag 3420 
ctaccaagac gaagaggatg aagaggatga ggaggcagat tgccttgaat atattgacaa 3480 
tactgataag ataatatatc ttttatatag aagatatcgc cgtatgtaag gatttcaggg 3540 
ggcaaggcat aggcagcgcg cttatcaata tatctataga atgggcaaag cataaaaact 3600 
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tgcatggact aatgcttgaa acccaggaca ataaccttat agcttgtaaa ttctatcata 3660 
attgggtaat gactccaact tattgatagt gttttatgtt cagataatgc ccgatgactt 3720 
tgtcatgcag ctccaccgat tttgagaacg acagcgactt ccgtcccagc cgtgccaggt 3780 
gctgcctcag attcaggtta tgccgctcaa ttcgctgcgt atatcgcttg ctgattacgt 3840 
gcagctttcc cttcaggcgg gattcataca gcggccagcc atccgtcatc catatcacca 3900 
cgtcaaaggg tgacagcagg ctcataagac gccccagcgt cgccatagtg cgttcaccga 3960 
atacgtgcgc aacaaccgtc ttccggagac tgtcatacgc gtaaaacagc cagcgctggc 4020 
gcgatttagc cccgacatag ccccactgtt cgtccatttc cgcgcagacg atgacgtcac 4080 
tgcccggctg tatgcgcgag gttaccgact gcggcctgag ttttttaagt. gacgtaaaat 4140 
cgtgttgagg ccaacgccca taatgcgggc tgttgcccgg catccaacgc cattcatggc 4200 
catatcaatg attttctggt gcgtaccggg ttgagaagcg gtgtaagtga actgcagttg 4260 
ccatgtttta cggcagtgag agcagagata gcgctgatgt ccggcggtgc ttttgccgtt 4320 
acgcaccacc ccgtcagtag ctgaacagga gggacagctg atagacacag aagccactgg 4380 
agcacctcaa aaacaccatc atacactaaa tcagtaagtt ggcagcatca cccataattg 4440 
tggtttcaaa atcggctccg tcgatactat gttatacgcc aactttgaaa acaactttga 4500 
aaaagctgtt ttctggtatt taaggtttta gaatgcaagg aacagtgaat tggagttcgt 4560 
cttgttataa ttagcttctt ggggtatctt taaatactgt agaaaagagg aaggaaataa 4620 
taaatggcta aaatgagaat atcaccggaa ttgaaaaaac tgatcgaaaa ataccgctgc 4680 
gtaaaagata cggaaggaat gtctcctgct aaggtatata agctggtggg agaaaatgaa 4740 
aacctatatt taaaaatgac ggacagccgg tataaaggga ccacctatga tgtggaacgg 4800 
gaaaaggaca tgatgctatg gctggaagga aagctgcctg ttccaaaggt cctgcacttt 4860 
gaacggcatg atggctggag caatctgctc atgagtgagg ccgatggcgt cctttgctcg 4920 
gaagagtatg aagatgaaca aagccctgaa aagattatcg agctgtatgc ggagtgcatc 4980 
aggctctttc actccatcga catatcggat tgtccctata cgaatagctt agacagccgc 5040 
ttagccgaat tggattactt actgaataac gatctggccg atgtggattg cgaaaactgg 5100 
gaagaagaca ctccatttaa agatccgcgc gagctgtatg attttttaaa gacggaaaag 5160 
cccgaagagg aacttgtctt ttcccacggc gacctgggag acagcaacat ctttgtgaaa 5220 
gatggcaaag taagtggctt tattgatctt gggagaagcg gcagggcgga caagtggtat 5280 
gacattgcct tctgcgtccg gtcgatcagg gaggatatcg gggaagaaca gtatgtcgag 5340 
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ctattttttg 


actfcactggg 


gatcaagcct 


gattgggaga aaataaaata 


ttatatttta 


5400 


ctggatgaat 


tgttttagta 


cctagatgtg 


gcgcaacgat gccggcgaca 


agcaggagcg 


5460 


caccgacttc 


ttccgcatca 


agtgttttgg 


ctctcaggcc 


gaggcGcacg 


gcaagtattt 


5520 


gggcaagggg 


tcgctggtat 


tcgtgcaggg 


caagattcgg aataccaagt 


acgagaagga 


5580 


cggccagacg 


gtctacggga 


ccgacttcat 


tgccgataag gtggattatc 


tggacaccaa 


5640 


ggcaccaggc 


gggtcaaatc 


aggaataagg 


gcacattgcc ccggcgtgag 


tcggggcaat 


5700 


cccgcaagga 


gggtgaatga 


atcggacgtt 


tgaccggaag gcatacaggc 


aagaactgat 


5760 


cgacgcgggg 


ttttccgccg 


aggatgccga 


aaccatcgca 


agccgcaccg 


tcatgcgtgc 


5820 


gccccgcgaa 


accttccagt 


ccgtcggctc 


gatggtccag caagctacgg 


ccaagatcga 


5880 


gcgcgacagc • 


gtgcaactgg 


ctccccctgc 


cctgcccgcg 


ccatcggccg 


ccgtggagcg 


5940 


ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


tttggcgaag 


tcgatgacca 


. tcgacacgcg 


6000 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag gacctggcaa 


aacaggtcag 


6060 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cacgaagcag cagatcaagg 


aaatgcagct 


6120 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga gcgatgccaa 


acgacacggc 


6180 


ccgctctgcc 


ctgttcacca 


cgcgcaacaa 


gaaaatcccg 


cgcgaggcgc 


tgcaaaacaa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


•accggcgtcg 


agctgcgggc 


6300 


cgacgatgac 


gaactggtgt 


ggcagcaggt 


gttggagtac 


gcgaagcgca 


cccctatcgg 


6360 


cgagccgatc 


accttcacgt 


tctacgagct 


ttgccaggac 


ctgggctggt 


cgatcaatgg 


6420 


ccggtattac 


acgaaggccg 


aggaatgcct 


gtcgcgccta 


caggcgacgg 


cgatgggctt 


6480 


cacgtccgac 


cgcgttgggc 


acctggaatc 


ggtgtcgctg 


Gtgcaccgct 


tccgcgtcct 


6540 


ggaccgtggc 


aagaaaacgt 


cccgttgcca 


ggtcctgatc 


gacgaggaaa 


tcgtcgtgct 


6600 


gtttgctggc 


gaccactaca 


cgaaattcat 


atgggagaag 


taccgcaagc 


tgtcgccgac 


6660 


ggc.ccgacgg 


atgttcgact 


atttcagctc 


gcaccggg'ag 


ccgtacccgc 


tcaagctgga 


6720 


aacctfcccgc 


ctcatgtgcg 


gatcggattc 


cacccgcgtg 


aagaagtggc 


gcgagcaggt 


6780 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


cggcctggtg 


gaacacgcct 


gggtcaatga 


6840 


tgacctggtg 


cattgcaaac 


gctagggcct 


■ tgtggggtca 


gttccggctg 


ggggttcagc 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca 


agcgggcact 


gctcgacgca 


cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


tacgaactgc 


cgataaacag 


aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggcttggag 


cggccgacgt 


gcaggatttc 


7080 



81 



cgcgagatcc 


gattgtcggc cctgaagaaa 


gctccagaga 


tgttcgggtc cgbttacgag 


7140 


cacgaggaga 


aaaagcccat ggaggcgttc 


gc tgaacggt 


tgcgagatgc cgfcggcattc 


7200 


ggcgcctaca 


tcgacggcga gatcattggg 


ctgtcggtct 


tcaaacagga ggacggcccc 


7260 


aaggacgctc 


acaaggcgca tctgtccggc 


gttttcgtgg 


agcccgaaca gcgaggccga 


7320 


ccrcrcrliccrc cq 


gtatgctgct gcgggcgttg 


ccggcgggtt 


tattgctcgt gatgatcgtc 


7380 


cgacagat tc • 


caacgggaat ctggtggatg 


cgcatcttca 


tcctcggcgc acttaatatt 


7440 


tcgc^atitict 


ggagcttgtt gtttatttcg 


gtctaccgcc 


tgccgggcgg ggtcgcggcg 


7500 




ctatacaacc actaatcrcrtc 


gtgttcatct' 


ctgccgctct gctaggtagc 


7560 


eecrataccrat 


haataaccrcrt cctcrcro^crcli 


atttgcggaa 


ctgcgggcgt ggcgctgttg 


7620 


^ w9 V wfcVrf WfcV^ 
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atcaoccrtca 


cagcgggcct ggcgggggcg 
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crtt tcca tcrcr 


ccrttico'aaac ccrtcrctcracc 


cgcaagtggc 


aacctcccgt gcctctgctc 


7740 


aectttacccr 


cctcracaact Dcrccfcrcca'a'a 


ggacttctgc 


tcgttccagt agctttagtg 


7800 


tfcfccratcccrc 


caat^cccgaC gcctacagga 


accaatgttc 


tcggcctggc gtggctcggc 


7860 


c t era t c crcracf 


cacran^tiaac c^actl^cct^ 


tggttccggg 


ggatctcgcg actcgaacct 


7920 


acacrii t crt 1 1 


ccttactggg ctttctcagc 


cccagatctg 


gggtcgatca gccggggatg 


7980 


ca'tcacrcrccGT 


acacrtcaaaa clitccrcrcr^cc 


ccgacctgta 


ccattcggtg agcaatggat 


8040 


aacrcraacrt tcr 
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atatcgtcaa cgttcacttc 


taaagaaata 


gcgccactca gcttcctcag 


8100 


^gg"C tttatC 


cagcgatttc ctattatgtc 


ggcatagttc 


tcaagatcga cagcctgtca 


8160 


G crcrt. taacTGcr 


aaaaaticraati aacaaocrctcr 


ataattcgga. 


tetctgcgag .ggagatgata 


8220 


tl^'bcratcaca 


crocacrcaacor ctictcrl^catc 


gttacaatca 


acatgctacc ctccgcgaga 


8280 


tcafceca'tcft 


ttcaaacccQ crcaocttacrt 


tgcogttctt 


ccgaatagca tcggtaacat 


8340 


cracrc aaacr t c 


tacccrcctta caacorcrctct 


cccgctgacg 


c'cgtcccgga ctgatgggct 


8400 


cTcctQtatccr 


agtggtgatt ttgtgccgag 


ctgccggtcg 


gggagctgtt ggctggctgg 


8460 


taacaaaata 


tattgtggtg taaacaaatt 


gacgcttaga 


caacttaata acacattgcg 


8520 


gacgttttta 


atgtactggg gtggtttttc 


ttttcaccag 


tigagacgggc aacagctgak 


ODOU 


tgcccttcac 


cgcctggccc tgagagagtt 


gcagcaagcg 


gtccacgctg gtttgcccca 


8640 


gcaggcgaaa 


atcctgtttg atggtggttc 


cgaaatcggc 


aaaatccctt ataaatcaaa 


8700 


agaatagccc 


gagatagggt tgagtgttgt 


tccagtttgg 


aacaagagtc cactattaaa 


8760 


gaacgtggac 


tccaacgtca aagggcgaaa 


aaccgtctat 


cagggcgatg gcccactacg 


8820 
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tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 
ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 8940 
ggaagggaag aaagcgaaag gagcgggcgc cattcaggct gcgcaactgt tgggaagggc 9000 
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 9060 
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 9120 
aattaattcc catcttgaaa gaaatatagt ttaaatattt attgataaaa taacaagtca 9180 
ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt cagaaatatt 9240 
tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag tgcgatatta 9300 
tgtgtaatac ataaattgat gatatagcta gcctagctca tcgggggatc cgtcgaagct 9360 
agcttgggtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat gcgctgcgaa 9420 
tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc gccaagctct 9480 
tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 
ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac 9660 
agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 
agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa gctcccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt' atggaacgtc 102 60 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttceiacgtt gcggttctgt cagttccaaa cgtaaciacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 
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cttaccagag 


ggcgccccag 


ctggcaattc 


cggttcgctt ' 


gctgtccata 


aaaccgccca 


10620 


gtctagctat 


cgccatgtaa 


gcccactgca 


agctacctgc 


tttctctttg' 


cgcttgcgtt 


10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aacgtctaaa 


cccttgtaat 


ttgtttt'tgt 


tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gataaatttt 


tatatttggt 


actaaattta 


taacaccttt 


tatgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta 


aatatttgct 


aatatttcta 


ctataggaga 


11100 


attaaagtga 


gtgaatatgg 


taccacaagg 


tttggagatt 


taattgttgc 


aatgctgcat 


11160 


crcratcrcrcata 


tacaccaaac 


attcaataat 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


tttaaaatcrc 


atgaacgtca 


cgtggacaaa 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat 


ggatgccctg 


tggaaagttt 


aaaaatattt 


11340 


tggaaatgat 


ttgcatggaa 


gccatgtgta 


aaaccatgac 


atccacttgg 


aggatgcsiat 


114UU 


aatgaasraaa 


actacaaatt 


tacatgcaac 


tagttatgca 


tgtagtctat 


ataatgagga 


11460 


ttttgcaata 


ctttcattca 


tacacactca 


ctaagtttta 


cacgattata 


atttcttcat 


11520 


agccagccca 


ccgcggtgga 


aa atg gag 
Met Glu 
1 


gtc gtg gag aga ttc tac ggt gag 
Val Val Glu Arg Phe Tyr Gly Glu 
5 10 


11572 



ttg gat ggg aag gtc teg cag ggc gtg aat gca ttg ctg ggt agt ttt 11620 
Leu Asp Gly Lys Val "Ser Gin Gly Val' Asn Ala Leu Leu Gly Ser Phe 
15 20 25 

ggg gtg gag ttg acg gat acg ccc act acc aaa ggc ttg ccc etc gtt 11668 
Gly Val Glu Leu Thr Asp Thr Pro Thr Thr Lys Gly Leu Pro Leu Val 
30 35 40 

gac agt ccc aca ccc ate gtc etc ggt gtt tct gta tac ttg act att . 11716 
Asp Ser Pro Thr Pro lie Val Leu Gly Val Ser Val Tyr Leu Thr lie 
45 50 55 

gtc att gga ggg ctt ttg tgg ata aag gcc agg gat ctg aaa ccg cgc 11764 
Val lie Gly Gly Leu Leu Trp He Lys Ala Arg Asp Leu Lys Pro Arg 
60 65 70 

gcc teg gag eca ttt ttg etc caa get ttg gtg ctt gtg cac aac ctg 11812 
Ala Ser Glu Pro Phe Leu Leu Gin Ala Leu Val Leu Val His Asn Leu 
75 • 80 85 .90 

ttc tgt ttt geg etc agt ctg tat atg tgc gtg ggc ate get tat cag 11860 
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Phe Cys Phe Ala Leu Ser Leu Tyr Met Cys Val Gly 'Ile Ala Tyr Gin 
95 100 105 

get att acc tgg egg tac tct etc tgg ggc aat gca tac aat cct aaa 11908 
Ala lie Thr Trp Arg Tyr ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys 
110 115 120 

cat aaa gag atg gcg att ctg gta tac ttg ttc tac atg tct aag tac 11956 
His Lys Glu Met Ala He Leu Val Tyr Leu Phe Tyr. Met Ser Lys Tyr 
125 130 135 

gtg gaa ttc atg gat acc gtt ate atg ata ctg aag cgc age acc agg 12004 
Val Glu Phe Met Asp Thr Val He Met He Leu Lys Arg Ser Thr Arg 
140 145 150 

caa ata age ttc etc cac gtt tat cat cat tct tea att tec etc att 12052 
Gin He Ser Phe Leu His Val Tyr His His Ser Ser He Ser Leu He . 
155 160 165 170 

tgg tgg get att get cat cac get cct ggc ggt gaa gca tat tgg tct 12100 
Trp Trp Ala He Ala His His Ala Pro Gly Gly Glu Ala Tyr Trp Ser 
175 180 185 

gcg get ctg aac tca gga gtg eat gtt etc atg tat gcg tat tac ttc 12148 
Ala Ala Leu Asn Ser Gly Val His Val Leu Met Tyr Ala Tyr Tyr Phe 
190* 195 200 

ttg get gee tgc ctt cga agt age cea aag tta aaa aat aag tac ctt 12196 
Leu Ala Ala Cys Leu Arg Ser Ser. Pro Lys Leu Lys Asn Lys Tyr Leu 
205 210 215 

ttt tgg ggc agg tac ttg aca caa ttc caa atg ttc cag ttt atg ctg 12244 
Phe Trp Gly Arg Tyr Leu Thr Gin Phe Gin Met Phe Gin Phe Met Leu 
220 225 230 

aac tta gtg cag get tac tac gac atg aaa acg aat gcg cca tat cea 12292 
Asn Leu Val Gin Ala Tyr Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro 
235 - - 240 245 • 250 

caa tgg ctg ate aag att ttg ttc tac tac atg ate teg ttg ctg ttt 12340 
Gin Trp Leu He Lys He Leu Phe Tyr Tyr Met He Ser Leu Leu Phe 
255 260 265 

ctt' ttc ggc aat ttt tac gta. caa aaa tac ate aaa ecc tct gac gga 12388 
Leu Phe Gly Asn Phe Tyr Val Gin Lys Tyr He Lys Pro Ser Asp Gly 
270 275 280 

aag caa- aag gga get aaa act gag tga tctagaaggc ctcctgcttt 12435 
.Lys Gin Lys Gly Ala Lys Thr Glu 
285 290 

aatgagatat gegagacgcc tatgategca tgatatttgc tttcaattct gttgtgcacg 12495 

ttgtaaaaaa cetgagcatg tgtagcteag atccttaeeg ccggtttegg tteattctaa 12555 

tgaatatatc accegttact ategtatttt tatgaataat attetccgtt . caatttactg 12615 



attgtecgte gagcaaattt acacattgcc actaaacgtc taaacccttg taatttgttt 12675 
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ttgttttact 


atgtgtgtta 


tgtatttgat 


ttgcgataaa 


tttttatatt 


tggtactaaa 


12735 


tttataacac 


cttttatgct 


aacgtttgcc 


aacacttagc 


aatttgcaag 


ttgattaatt 


12795 


gattctaaat 


tatttttgtc 


ttctaaatac 


atatactaat 


caactggaaa 


tgtaaatatt 


12855 


tgctaatatt 


tctactatag 


gagaattaaa 


gtgagtgaat 


atggtaccac 


aaggtttgga 


12915 


gatttaattg 


ttgcaatgct 


.gcatggatgg 


catatacacc 


aaacattcaa 


taattcttga 


12975 


ggataataat 


ggtaccacac 


aagatttgag 


gtgcatgaac 


gtcacgtgga 


caaaaggttt 


13035 


agtaattttt 


caagacaaca 


atgttaccac 


acacaagttt 


tgaggtgcat 


gcatggatgc 


13095 


cctgtggaaa 


gtttaaaaat 


attttggaaa 


tgatttgcat 


ggaagccatg 


tgtaaaacca 


13155 


tgacatccac 


ttggaggatg 


caataatgaa gaaaactaca 


aatttacatg 


caactagcta 


13215 


tgcatgtagt 


ctatataatg 


aggattttgc 


ciatactttca 


ttcatacaca 


ctcactaagt 


13275 


tttacacgat 


tataatttct 


tcatagccag cggatcc atg gta ttc gcg ggc ggt 
• Met Val Phe Ala Gly Gly 


13330 



295 

gga ctt cag cag ggc tct ctc.gaa gaa aac ate gac gtc gag cac att 13378 
Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn .lie Asp val Glu His lie 
300 305 310 

gcc agt atg tct etc ttc age gac ttc ttc agt tat gtg tct tea act 13426 
Ala Ser Met Ser Leu Phe Ser Asp Phe Phe Ser Tyr Val Ser Ser Thr 
315 320 325 

gtt ggt teg tgg age gta cac agt ata caa cct ttg aag egc ctg acg 13474 
Val Gly Ser Trp Ser Val His Ser lie Gin Pro Leu Lys Arg Leu T!hr . 
330 335 . • 340 345 

agt aag aag cgt gtt teg gaa age get gcc gtg caa tgt ata tea get 13522 
Ser Lys Lys Arg val Ser Glu Ser Ala Ala val Gin Cys He Ser Ala 
350 355 ... . 360 • 

gaa gtt cag aga aat teg agt ace cag gga act gcg gag gca etc gea 13570 
Glu Val Gin Arg Asn Ser Ser Thr Gin Gly Thr Ala Glu Ala Leu Ala 
365 . 370 I "; 375 . 

gaa tea gtc gtg aag ccc acg aga cga agg tea tct cag tgg aag aag 13618 
Glu Ser Val Val Lys Pro Thr Arg Arg Arg Ser Ser Gin Trp Lys Lys 
380 • 385 390 

teg aca cac ccc eta tea gaa gta gca gta cac aac aag cca age gat 13666 
ser Thr His Pro Leu Ser Glu val Ala val His Asn Lys Pro Ser Asp 
395 400 405 

tge tgg att gtt gta aaa aac aag gtg* tat gat gtt tec aat ttt gcg 13714 
Cys Trp He Val Val Lys Asn Lys Val Tyr Asp Val Ser Asn Phe Ala 
410 415 420 425 ' 

gac gag eat ccc gga gga tea gtt att agt act tat ttt gga cga gac 13762 
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Asp 


Glu 


His Pro 


Gly 
430 


Gly 


Ser 


Val 


He 


Ser 
435 


Thr 


Tyr 


Phe 


Gly 


Arg 
440 


Asp 




ggc 
Gly 


aca 
Thr 


gat gtt 
Asp Val 

445 

j ! 


ttc 
Phe 


tct 
Ser 


agt 
Ser 


ttt 
Phe 


cat 
His 
450 


gca 
Ala 


get 
Ala 


tct 
Ser 


aca 
Thr 


tgg 
Trp 
455 


aaa 
Lys 


att 
He 


13810 


ctt 
Leu 


caa 
Gin 


gac ttt 
Asp Phe 
460 


tac 
Tyr 


att 
lie 


ggt 
Gly 


gac 
Asp 
465 


gtg 

Val 


gag 

Glu 


agg 
Arg 


gtg 
Val 


gag 
Glu 
470 


ceg 
Pro 


act 
Thr 


cea 
Pro 


13858 


gag 
Glu 


ctg 
Leu 
475 


^ .1 

ctg aaa 
Leu Lys 


gat 
Asp 


ttc 
Phe 


cga 
Arg 
480 


gaa 
Glu 


atg 
Met 


aga 
Arg 


get 
Ala 


ctt 
Leu 
485 


ttc 
Phe 


ctg 
Leu 


agg 
Arg 


gag 

Glu 


13906 


caa 
Gin 
490 


ctt 
Leu 


ttc aaa 
Phe Lys 


agt 
Ser 


teg 
Ser. 
495 


aaa 
Lys 


ttg 
Leu 


tac 
Tyr 


tat 
Tyr 


gtt 

val 
500 


atg 
Met 


aag 
Lys 


ctg 
Leu 


etc 
Leu 


acg 
Thr 
505 


13954 


aat 
Asn 


gtt 
Val 


get att 
Ala He 


ttt 
Phe 
510 


get 
Ala 


gcg 
Ala 


age 
.Ser 


att 
He 


gca 
Ala 
515 


ata 
He 


ata 
He 


tgt 
Cys 


■tgg 
Trp 


age 
Ser 
520 


aag 
Lys 


14002 


act 
Thr 


att 
lie 


tea gcg 
Ser Ala 
525 


gtt 
Val 


ttg 
Leu 


get 
Ala 


tea 
Ser 


get 
Ala 
530 


tgt 
Cys 


atg 
Met 


atg 
Met 


g-ct 
Ala 


ctg 
Leu 
535 


tgt 
Cys 


ttc" 
Phe 


14050 


caa 
Gin 


cag 
Gin 


tgc gga 
Cys Gly 
540 


tgg 
Trp 


eta 
Leu 


tec 
Ser 


cat 
His 
545 


gat 
Asp 


ttt 
Phe 


etc 
Leu 


cac 
His 


aat 
Asn 
550 


cag 
•Gin 


gtg 
val 


ttt 
Phe 


14098 


gag 
Glu 


aca 
Thr 
555 


cgc tgg 
Arg Trp 


ctt 
Leu 


aat 
Asn 


gaa 
Glu 
560 


gtt 
Val 


gtc 
Val 


ggg 
Gly 


tat 
Tyr 


gtg 
Val 
565 


ate 
He 


ggc 
Gly 


aac 
Asn 


gcc . 
Ala 


14146 


gtt 
Val 
570 


ctg 
Leu 


ggg ttt 
Gly Phe 


agt 
Ser 


aca 
Thr- 
575 


ggg 
Gly 

*,\ 


tgg 
Trp 


tgg 
Trp 


aag 
Lys 


gag 

Glu 
580 


aag 
Lys 


cat 
His 


aac 
Asn 


ctt 
Leu 


cat 
His 
585 


14194 


cat 
Kis 


get 
Ala 


get' cea 
Ala Pro 


aat 
Asn 
590 


gaa" 
Glu 


tgc 
Cys 


gat 

Asp 


cag 
Gin 


act 
Thr 
595 


tac 
Tyr 


caa 
Gin 


cea 
Pro 


att 
He 


gat 
Asp 
600 


gaa 
Glu 


14242 


gat 
Asp 


att 
He 


gat act 
Asp Thr 
605 


etc 
Leu 


cec 
Pro 


etc 
Leu 


att 
lie 


gee 
Ala 
610 


tgg 
Trp 


age 
Ser 


aag 
Lys 


gac 
Asp 


ata 
He 
615 


ctg 
Leu 


gee 
Ala 


14290 


aca 
Thr 


gtt 
val 


gag aat 
Glu Asn 
620 


aag 
Lys 


aca 
Thr 


ttc 
Phe 


ttg 
Leu 
625 


cga 
Arg 


ate 
He 


etc 
Leu 


caa 
Gin 


tac 
Tyr 
630 


cag 
Gin 


cat 
His 


ctg 
Leu 


14338 


ttc 
Pile 


ttc 
Phe 
635 


atg ggt 
Met Gly 


ctg 
Leu 


tta 
Leu 


ttt 
Phe 
640 


ttc 
Phe 


gee 
Ala 


cgt 
Arg 


ggt 

Gly 


agt 
Ser 
645 


tgg 
Trp 


etc 
Leu 


ttt 
Phe 

{. 


tgg 
Trp 


14386 


age 
Ser 
650 


tgg 

Trp 


aga tat 
Arg Tyr 


ace 
Thr 


tct 
Ser 
655 


aca 
Thr 


gca 
Ala 


gtg 
val 


etc 
Leu 


tea 
Ser 
660 


cet 
Pro 


gtc 
Val 


gac 
Asp 


agg 
Arg 


ttg 
Leu 
665 


14434 
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ttg gag aag gga act gtt ctg ttt cac tac ttt tgg ttc gtc ggg aca 14482 
Leu Glu Lys Gly Thr Val Leu Phe His Tyr Phe Trp Phe Val Gly Thr 
670 675 680 

gcg tgc tat ctt etc cct ggt tgg aag cca tta gta tgg atg gcg gtg 14530 
Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro Leu val Trp Met Ala Val 
685 690 695 

act gag etc atg tec ggc atg ctg ctg ggc ttt gta -ttt gta ctt age 14578 
Thr Glu Leu Met Ser Gly Met Leu Leu Gly Phe Val Phe Val Leu Ser 
700 * 705 .710 

I ' /. 

cac aat ggg atg gag gtt tat aat teg tct' aaa gaa ttc gtg agt gca 14626 
His Asn Gly Met Glu Val Tyr Asn Ser Ser Lys Glu Phe Val Ser Ala 
715- 720 725 

cag ate gta tec aca egg gat ate. aaa gga aac ata ttc aac gac tgg 14674 
Gin He Val Ser Thr Arg Asp He Lys Gly Asn He Phe Asn Asp Trp 
730 735 740 745 

ttc act ggt ggc ctt aacagg caa ata gag cat eat ctt ttc cca aca 14722 
Phe Thr Gly Gly Leu Asn Afg Gin He Glu His His Leu Phe Pro Thr 
750 -755 760 

atg ccc agg cat aat tta aac aaa ata gca cct aga gtg gag gtg ttc 14770 
Met Pro Arg His Asn Leu Asn Lys He Ala- Pro Arg Val Glu val Phe 
765 770 775 

tgt aag aaa cac ggt ctg gtg. tac gaa gac gta. tct att get ace ggc 14818. 
Cys Lys Lys His Gly Leu Val Tyr Glu Asp Val Ser He Ala Thr Gly 
780 785 790 

act tgc aag gtt ttg aaa gca ttg aag gaa gtc gcg gag get gcg gca 14866 
Thr Cys Lys Val Leu Lys Ala Leu Lys Glu Val Ala Glu Ala Ala Ala 
795 800 805 

gag cag cat get acc acc agt taa gctagcgtta accctgcttt aatgagatat 14920 
Glu Gin His Ala Thr Thr ser 
810 815 



gcgagacgcc 


tatgatcgca 


tgatatttgc 


tttcaattct 


gttgtgcacg 


ttgtaaaaaa 


14980 


cctgagcatg 


tgtagctcag 


atccttaccg 


ccggtttcgg 


ttcattctaa 


tgaatatatc 


15040 


acccgttact 


atcgtatttt 


tatgaataat 


attctccgtt 


caatttactg 


attgtccgtc 


15100 


gacgaattcg 


agctcggcgc 


gcetetagag 


gatcgatgaa 


ttcagatcgg 


ctgagtggct 


15160 


ccttcaacgt 


tgcggttetg 


tcagttccaa 


acgtaaaacg 


gcttgtcccg 


cgtcatcggc 


15220 


gggggtcata 


acgtgactcc 


cttciattctc 


cgctcatgat 


cagattgtcg 


tttcecgcct 


15280 


tcagtttaaa 


ctatcagtgt 


ttgacaggat 


atattggcgg 


gtaaacctaa. 


gagaaaagag 


15340 


cgtttattag 


aataatcgga 


tatttaaaag 


ggcgtgaaaa 


ggtttatcct 


tcgtccattt 


15400 


gtatgtgcat 


gccaaccaca 


gggtteccca 








15430 
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<210> 26 
<211> 290 
<212> PRT 

<213> UnJoiovm • . 
<400> 26 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
15 10 15 

Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20 . 25 30 

Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro lie 
35 40 45 

Val Leu Gly Val Ser Val Tyr Leu Thr Ile Val Ile Gly Gly Leu Leu 

50 55 ' . 60 . • 

Trp Ile Lys Ala Arg Asp Leu Lys .Pro Arg Ala Ser Glu Pro Phe Leu 
65 • 70 . 75 80 

Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 
85 90 95 

Leu Tyr Met Cys Val Gly lie Ala Tyr Gin Ala lie Thr Trp Arg Tyr 
100 105 110 

Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala Ile 
115 120 125 

Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 13-5 140 

Val ile Met lie Leu Lys Arg Ser Thr Arg Gin lie Ser Phe Leu His 
145 150 155 160 

Val Tyr His His Ser Ser lie Ser Leu He Trp Trp Ala He Ala His 
165 170 175 

His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn ser Gly 
180 185 190 

Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
195 200 205 

Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
210 215 220 

Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 

Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu lie Lys lie 
245 250 255 

Leu Phe Tyr Tyr Met Ile Ser Leu Leu Phe Leu Phe Gly Asn. Phe Tyr 
26Q 265 270 
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Val Gin Lys Tyr lie Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 



Thr Glu 
290 



<210> 27 
<211> 525 
<212> PRT 
<213> unknown 



<400> 27 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
1 ■ • 5 . 10 15 

Jle Asp Val Glu His lie Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 

. ' 20 - ■ 25 30 

Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser lie Gin 
35 ■ . 40 45' 

Pro Leu Lys Arg Leu Thr Ser . Lys Lys Arg Val Ser Glu Ser Ala Ala 
.50 ■ 55 60 

val Gin Cys lie Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
65 70 75 80 

Thr Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Thr Arg Arg Arg 
85 90 95 • 

Ser Ser Gin Trp Lys Lys Ser Thr His* Pro Leu Ser Glu Val Ala Val 
100 105 110 

His Asn Lys Pro Ser Asp Cys Trp He Val Val Lys Asn^Lys Val Tyr- 
115 , 120 125 

Asp Val Ser Asn Phe Ala Asp Glu" His Pro Gly Gly Ser Val He Ser 
130 135 140 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 
145 . 150 155 • 160 

Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
165 170 1*75 

Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
180 185' 190 

Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
19.5 200 205 

Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 
210 215 220 

He He Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 
225 230 235 240 
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Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 

Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn ,Glu Val Val Gly 
260 265 . 270 

Tyr Val He Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 
275 280 285 

Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 
290 295 300 

Tyr Gin Pro He Asp Glu Asp He Asp Thr Leu Pro Leu Tie Ala Trp 
305 310 ^ 315 320 

Ser Lys Asp He Leu. Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 
325 330 335 

Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 350 

Gly Ser Trp Leu Phe^Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu 
. 355 360 365 

Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370 375. 380 

Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lye Pro 
385 390 395 - 400 

Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 415 

Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 

420 ' 425 430 

Lys Glu Phe Val Ser Ala Gin He* Val Ser Thr Arg Asp He Lys .Gly 
435 440 445 

Asn He Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin He Glu 
450 455 460 

His His Leu Phe Pro Thr Met Pro Arg His Asn. Leu Asn Lys He Ala 
465 470 475 480 

Pro Arg Val Glu Val Phe Cys. Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

Val Ser He Ala Thr Gly Thr Cys Lys val Leu Lys Ala Leu Lys Glu 

500 , 505 .510..., 

*i _* i \ 

Val Ala Glu Ala Ala Ala Glu Gin Has Ala Thr Thr Ser 
515 • 520 525 



<210> 28 
<211> 17752 
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<212> DNA 
<213> Unknown 

<220> 

<223> pflanz. E3^ressionsvektor mit 3 

Promotor-Terminator- Expressionskassetten 
inseriert mit Physcoroitrella Elongaee + Desaturase 
+ Phaeodactyltim Desaturase 

<220> 
<221> CDS 

<222> (11543) (12415) 

<220> 
<221> CDS 

<222> (13313) . . (14890) 

<220> 
<:221> CDS 

<222> (15791) . . (17200) 
<400> 28 



gatctggcgc 


cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 


60 


gcgcccagca 


caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca 


120 


tagtgggcgg 


tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg cagcaccggc 


180 


ataatcaggc 


cgatgccgac agcgtcgagc . gcgacagtgc tcagaattac gatcaggggt 


240 


atgttgggtt 


tcacgtctgg cctccggacc agcctccgct ggtccgattg aacgcgcgga 


300 


ttctttatca 


ctgataagtt ggtggacata ttatgtttat cagtgataaa gtgtcaagca 


360 


tgacaaagtt 


•1 

gcagccgaat acagtgatcc gtgccgccct ggacctgttg aacgaggtcg 


420 


gcgtagacgg 


tctgacgaca cgcaaactgg cggaacggtt gggggttcag cagccggcgc 


480 


tttactggca 


cttcaggaac aagcgggcgc tgctcgacgc actggccgaa gccatgctgg 


540 


cggagaatca 


tacgcattcg gtgccgagag ccgacgacga ctggcgctca tttctgatcg 


600 


ggaatgcccg 


cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg cgcatccatg 


660 


ccggcacgcg 


accgggcgca ccgcagatgg aaacggccga cgcgcagctt cgcttcctct 


720 . 


gcga'ggcggg 


tttttcggcc ggggacgccg tcaatgcgct gatgacaatc agctacttca 


780 


ctgttggggc 


cgtgcttgag gagcaggccg gcgacagcga tgccggcgag cgcggcggca 


840 


ccgttgaaca 


ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc ttcgacgaag 


900 


ccggtccgga 


cgcagcgttc gagcagggac tcgcggrtgat tgtcgatgga ttggcgaaaa 


960 


ggaggctcgt 


tgtcaggaac gttgaaggac cgagaaaggg tgacgattga tcaggaccgc 


1020 


tgccggagcg 


caacccactc actacagcag agccatgtag acaacatccc ctcccccttt 
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ccaccgcgtc 


agacgcccgt 


agcagcccgc 


ccaagcctca 


cggccgcgct 


cggcctctct 


gctcactgac 


tcgctgcgct 


cggftcgttcg 


ggcggtaata 


cggttatcca 


cagaatcagg 


aggccagcaa" 


aaggccagga 


accgtaaaaa 


ccgcccccct 


gacgagcatc 


acaaaaatcg 


aggactataa 


agataccagg 


cgtttccccc 


gaccctgccg 


cttaccggat 


acctgtccgc 


ccgctgcata 


acccfcgcttc 


ggggtcatta 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


agggcagccc 


acctatcaag 


gtgtactgcc 


aggcggcggc 


ggccggcatg 


agcctgtcgg 


aaatcacggg. 


cgtcgtggac 


tatgagcacg 


tgggccgcct 


gggcggcctg 


ctgaaa'ctct 


tcggtgatgc 


.cacgatcctc 


gccctgctgg 


gcaaggtcat 


gatgggcgtg 


gtccgcccga 


aacggccggg 


gggtgcgcgt 


gattgccaag 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgctcacc 


gggctggttg 


ccctcgccgc 


cgcgccagaa 


acgccgtcga 


agccgtgtgc 


cctcgcggaa 


aacttggccc 


tcactgacag 


cgactcaccc 


ggcgcggcgt 


tgacagatga 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa 


gatgtggaca 


agcctgggga 


taagtgccct 


tgacagatga 


ggggcgcgat 


ccttgacact 


gcacctattg 


acatttgagg 


ggctgtccac 
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tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1260 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


ctttctccct 


tcgggaagcg 


tggcgctttt 


1560 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 


ttccagacga 


acgaagagcg 


attgaggaaa 


1920 


cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 


gggcagagcc 


atgaettttt 


tagccgctaa 


2220 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 
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ccgcccgttt 


ttcggccacc 


gctaacctgt 


cttttaacct 


gcttttaaac 


caatatttat 


2880 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


gtgcgcgtga 


ccgcgcacgc 


c gaagggggg 


2940 


tgccccccct 


tctcgaaccc 


tcccggcccg 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


tgcgcccctc 


ggccgcgaac 


ggcctcaccc 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


ttgccgggat 


cggggcagta 


acgggatggg 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


ttgacgtgcc 


gcaggtgctg 


.gcatcgacat 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


gcggcctggg 


tggcggcctg 


cccttcactt 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


cggggccggc 


aatttttacc 


ttgggcattc 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


tgttcggggg 


tgcgataaac 


ccagcgaacc 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


gtatgaaaac 


gagaattgga. 


cet.ttacaga 


attactctat. 


•gaagcgccat 


atttaaaaag 


3420 


ctaccaagac 


gaagaggatg 


aagaggatga 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


tactgataag 


ataatatatc 


ttttatatag 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


ggcaaggcat 


aggcagcgcg 


cttatcaata 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


tgcatggact 


aatgcttgaa 


acccaggaca 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


tattgatagt 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


acagcgactt 


ccgtcccagc 


cgtgccaggt 


3780 


gctgcctcag 


attcaggtta 


tgccgctcaa 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttcc 


cttcaggcgg 


gattcataca 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 


cgtcaaaggg 


tgacagcagg 


ctcataagac 


gccccagcgt 


cgccatagtg 


cgttcaccga 


3960 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


gcgatttagc 


cccgacatag 


ccccactgtt 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


tgcccggctg 


tatgcgcgag 


gttaccgact 


gcggcctgag 


ttttttaagt 


gacgtaaaat 


4140 


cgtg1:tgagg 


ccaacgccca 


taatgcgggc 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 


catatcaatg 


attttctggt 


gcgtaccggg 


ttgagaagcg 


gtgtaagtga 


actgcagttg 


4260 


ccatgtttta 


cggcagtgag 


agcagagata 


gcgctgatgt 


ccggcggtgc 


ttttgccgtt 


4320 


acgcaccacc 


ccgtcagtag 


ctgaacagga 


gggacagctg 


atagacacag 


aagccactgg 


4380 


agcacctccia 


aaacaccatc 


atacactaaa 


tcagtaagtt 


ggcagcatca 


cccataattg 


4440 


tggtttcaaa 


atcggctccg 


tcgatactat 


gttatacgcc 


aactttgaaa 


acaactttga 


4500 


aaaagctgtt 


ttctggtatt 


taaggtttta 


gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 
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cttgttataa 


ttagcttctt 


ggggtatctt 


taaatactgt 


agaaaagagg 


aaggaaataa 


4620 


taaatggcta 


aaatgagaat 


atcaccggaa 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4580 


gtaaaagata 


cggaaggaat 


gtctcctgct 


aaggtatata 


agctggtggg 


agaaaatgaa 


4740 


aacctatatt 


taaaaatgac 


ggacagccgg 


tataaaggga 


ccacctatga 


tgtggaacgg 


4800 


gaaaaggaca 


tgatgctatg 


gctggaagga 


aagctgcctg 


ttccaaaggt 


cctgcacttt 


4860 


gaacggcatg 


atggctggag 


caatctgctc 


atgagtgagg 


. ccgatggcgt 


cctttgctcg 


4920 


gaagagtatg 


aagatgaaca 


aagccctgaa 


aagattatcg 


agctgtatgc 


ggagtgcatc 


4980 


aggctctttc 


actccatcga 


catatcggat 


tgtccctata 


cgaatagctt 


agacagccgc 


5040 


ttagccgaat 


tggattactt 


actgaataac 


gatctggccg 


atgtggattg 


.cgaaaactgg 


5100 


gaagaagaca 


ctccatttaa 


agatccgcgc 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


cccgaagagg 


aacttgtctt 


ttcccacggc 


gacctgggag 


acagcaacat 


ctttgtgaaa 


5220 


gatggcaaag 


taagtggctt 


tattgatctt 


gggagaagcg 


gcagggcgga 


caagtggtat 


5280 


gacattgcct 


tctgcgtccg 


gtcgatcagg 


gaggatatcg 


gggaagaaca 


gtatgtcgag 


5340 


ctattttttg 


acttactggg 


gatcaagcct 


gattgggaga 


aaataaaata 


ttatatttta 


5400 


ctggatgaat 


tgttttagta 


cctagatgtg 


gcgcaacgat 


gccggcgaca 


agcaggagcg 


5460 


caccgacttc 


ttccgcatca 


agtgttttgg 


ctctcaggcc 


gaggcccacg 


gcaagtattt 


5520 


gggcaagggg 


tcgctggtat 


tcgtgcaggg 


caagattcgg 


aataccaagt 


acgagaagga 


5580 


cggccagacg 


gtctacggga 


ccgacttcat 


tgccgataag 


gtggattatc 


tggacaccaa 


5640 


ggcaccaggc 


gggtcaaatc 


aggaacaagg 


gcacattgcc 


ccggcgtgag 


tcggggcaat 


5700 


cccgcaagga 


gggtgaatga 


atcggacgtt 


tgaccggaag 


gcatacaggc 


aagaactgat 


5760 


cgacgcgggg 


ttttccgccg 


aggatgccga 


aaccatcgca 


agccgcaccg 


tcatgcgtgc. 


5820 


gccccgcgaa 


accttccagt 


ccgtcggctc 


gatggtccag 


caagctacgg 


cceiagatcga 


5880 


gcgcgacagc 


gtgcaactgg 


ctccccctgc 


cctgcccgcg 


ccatcggccg 


ccgtggagcg 


5940 


ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


tttggcgaag 


tcgatgacca 


tcgacacgcg 


6000 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag 


gacctggcaa 


aacaggtcag 


6060 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cacgaagcag 


cagatcaagg 


aaatgcagct 


6120 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 


6180 


ccgctctgcc 


ctgttcacca 


cgcgcsLacaa 


gaaaatcccg 


cgcgaggcgc 


tgcaaaacaa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


accggcgtcg 


agctgcgggc 


6300 
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cgacgatgac 


gaactggtgt 


ggcagcaggt 


gttggagtac 


gcgaagcgca 


cccctatcgg 


6360 


cgagccgatc 


accttcacgt 


tctacgagct 


ttgccaggac 


ctgggctggt 


cgatcaatgg 


6420 


ccggtattac 


acgaaggccg 


aggaatgcct 


gtcgcgccta 


caggcgacgg 


cgatgggctt 


6480 


cacgtccgac 


cgcgttgggc 


acctggaatc 


ggtgtcgctg 


ctgcaccgct 


tccgcgtcct 


6540 


ggaccgtggc 


aagaaaacgt 


cccgttgcca 


ggtcctgatc 


gacgaggaaa 


tcgtcgtgct 


6600 


gtttgctggc 


gaccactaca 


cgaaattcat 


atgggagaag 


taccgcaagc 


tgtcgccgac 


6660 


ggcccgacgg 


atgttcgact 


atttcagctc 


gcaccgggag 


ccgtacccgc 


fccaagctgga 


6720 


aaccttccgc 


ctcatgtgcg 


gatcggattc 


cacccgcgtg 


aagaagtggc 


gcgagcaggt 


•6780 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


cggcctggtg 


gaacacgcct 


gggtcaatga" 


6840 


tgacctggtg 


cattgcaaac 


gctagggcct 


tgtggggtca 


gttccggctg 


gg§rgttcagc 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca 


agcgggcact 


gctcgacgca 


cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


tacgaactgc 


cgataaacag 


aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggcttggag 


cggccgacgt 


gcaggatttc 


7080 


cgcgagatcc 


gat fcgt cggc 


cctgaagaaa 


gctccagaga 


tgttcgggtc 


cgtttacgag 


7140 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


gctgaacggt 


tgcgagatgc 


cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga 


gatcattggg 


ctgtcggtct 


tcaaacagga 


ggacggcGcc 


7260 


aaggacgctc 


acaaggcgca 


tctgtccggc 


gttttcgtgg 


agcccgaaca 


gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt " 


tattgctcgt 


gatgatcgtc 


7380 


cgacagattc 


caacgggaat 


ctggtggatg 


cgcatcttca 


tcctcggcgc 


acttaatatt 


7440 


tcgctattct- 


ggagcttgtt 


gtttatttcg 


gtctaccgcc 


tgccgggcgg 


ggtcgcggcg 


7500 


acggtaggcg 


ctgtgcagcc 


gctgatggtc 


gtgttcatct 


ctgccgctct 


gctaggtagc 


7560 


ccgatacgat 


tgatggcggt 


cctgggggct 


atttgcggaa 


ctgcgggcgt 


ggcgctgttg 


7620 


gtgttgacac 


caaacgcagc 


gctagatcct 


gtcggcgtcg 


cagcgggcct 


ggcgggggcg 


7680 


gtttccatgg 


cgttcggaac 


cgtgctgacc 


cgcaagtggc 


aacctcccgt 


gcctctgctc 


7740 


acctttaccg 


cctggcaact 


ggcggccgga 


ggacttctgc 


tcgttccagt 


agctttagtg 


7800 


tttgatccgc 


caatcccgat 


gcctacagga 


accaatgttc 


tcggcctggc 


gtggctcggc 


7860 


ctgatcggag 


cgggtttaac 


ctacttcctt 


tggttccggg 


ggatctcgcg 


actcgaacct 


7920 


acagttgttt 


ccttactggg 


ctttctcagc 


cccagatctg 


gggtcgatca 


gccggggatg 


7980 


catcaggccg 


acagtcggaa 


cttcgggtcc 


ccgacctgta 


ccattcggtg 


agcaatggat 


8040 
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aggggagttg atatcgtcaa cgttcacttc taaagaaata gcgccactca gcttcctcag 8100 
cggctttatc cagcgatttc ctattatgtc ggcatagttc tcaagatcga cagcctgtca 8160 
cggttaagcg agaaatgaat aagaaggctg ataattcgga tctctgcgag ggagatgata 8220 
tttgatcaca ggcagcaacg ctctgtcatc gttacaatca acatgctacc ctccgcgaga 8280 
tcatccgtgt ttcaaacccg gcagcttagt tgccgttctt ccgaatagca tcggtaacat 8340 
' gagcaaagtc tgccgcctta caacggctct cocgctgacg ccgtcccgga ctgatgggct 8400 
gcctgtatcg agtggtgatt ttgtgccgag ctgccggtcg gggagctgtt ggctggctgg 8460 
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 8520 
gacgttttta atgtactggg gtggtttttc ttttcaccag tgagacgggc aacagctgat 8580 
tgcccttcac cgcctggccc tgagagagtt gcagcaagcg gtccacgctg gtttgcccca 8640 
gcaggcgaaa atcctgtttg atggtggttc cgaaatcggc aaaatccctt ataaatcaaa 8700 
agaatagccc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 8760 
gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 8820 
tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 
ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 8940 
ggaagggaag aaagcgaaag gagcgggcgc cattcaggct gcgcaactgt tgggaagggc 9000 
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 9060 
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 9120 
aattaattcc catcttgaaa gaaatatagt ttaaatattt attgataaaa taacaagtca 9180 
ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt cagciaatatt .9240 
tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag tgcgatatta 9300 
tgtgtaatac ataaattgat gatatagcta gcttagctca tcgggggatc cgtcgaagct 9360 
agcttgggtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat gcgctgcgaa 9420 
tcgggagcgg cgataccgta aagcacgagg ciagcggtcag cccattcgcc gccaagctct 9480 
tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 
ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac 9660 
agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
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gtagccggat 


caagcgtatg 


cagccgccgc 


attgcatcag 


ccatgatgga 


tactttctcg 


9840 


gcaggagcaa 


ggtgagatga 


caggagatcc 


tgccccggca 


cttcgcccaa 


tagcagccag 


9900 


tcccttcccg 


cttcagtgac 


aacgtcgagc 


acagctgcgc 


aaggaacgcc 


cgl: eg tggcc 


9960 


agccacgrata 


gccgcgctgc 


ctcgtcctgc 


agt teat tea 


gggcaccgga 


caggtcggtc 


10020 


ttgacaaaaa 


gaaccgggcg 


cccctgcgct 


gacagccgga 


acacggcggc 


atcagagcag 


10080 


ccgattgtct 


gttgtgccca 


gtcatagccg 


aatagcctct 


ccacccaagc 


ggccggagaa 


10140 


cctgcgtgca 


atccatcttg 


ttcaatccaa 


gcteccatgg 


gccctcgact 


agagtcgaga 


10200 


tctggattga 


gagtgaatat 


gagactctaa 


ttggataccg 


aggggaattt 


atggaacgtc 


10260 


agtggagcat 


ttttgacaag 


aaatatttgc 


tagctgatag 


tgaccttagg 


cgacttttga 


10320 


acgcgcaata 


atggtttctg 


acgtatgtgc 


ttagctcatt 


aaaetccaga 


aacccgcggc 


10380 


tgagtggctc 


cttcaacgtt 


gcggttctgt 


cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


10440 


gtcatcggcg 


ggggtcataa 


cgtgactccc 


ttaattctcc 


gctcatgatc 


ttgatcccct 


10500 


gcgccatcag 


atccttggcg 


gcaagaaagc 


catccagttt 


actttgcagg 


gcttcccaac 


10560 


cttaccagag 


ggcgccccag 


ctggcaattc 


cggttcgctt 


gcfcgtccafca 


aaaccgccca 


10620 


gtctagctat 


cgccatgtaa 


gcccactgca 


agctacctgc 


tttctctttg 


cgcttgcgtt 


10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aacgtctaaa 


cccttgtaat 


ttgtttttgt 


tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gataaatttt 


tatatttggt 


actaaattta 


taacaccttt 


tafcgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta 


aatatttgct 


aatatttcta 


ctataggaga 


11100 


attaaagtga 


gtgaatatgg 


taccacaagg 


tttggagatt 


taattgttgc 


aatgctgcat 


11160 


ggatggcata 


tacaccaaac 


attcaataat 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


tttgaggtgc 


atgaacgtca 


cgtggacaaa 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat 


ggatgccctg 


tggaaagttt 


aeiaaatattt 


11340 


tggaaatgat 


ttgcatggaa 


gccatgtgta 


aaaccatgac 


atccacttgg 


aggatgcaat 


11400 


aatgaagaaa 


actacaaatt 


tacatgcaac 


tagttatgca 


tgtagtctat 


ataatgagga 


11460 


ttttgcaata 


ctttcattca 


tacacactca 


ctaeigtttta 


cacgattata 


atttcttcat 


11520 
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agccagccca ccgcggtgga aa atg gag gtc gtg gag aga ttc tac ggt gag 11572 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu 
15 10 

ttg gat ggg aag gtc teg cag ggc gtg aat gca ttg ctg ggt agt ttt 11620 
Leu Asp Gly Lys Val Ser Gin Gly Val Asn Ala Leu Leu Gly Ser Phe 
15 20 25 

ggg gtg gag ttg acg gat acg ccc act acc aaa ggc ttg ccc etc gtt . 11668 
Gly Val Glu Leu Thr Asp Thr Pro Thr Thr Lys Gly Leu. Pro Leu Val 
30 • 35 40 

gac agt ccc aca ccc ate gtc etc ggt gtt tct gta tac ttg act att 11716 
Asp Ser Pro Thx. Pro lie Val Leu Gly Val Ser Val Tyr Leu TPhr lie 
45 50 55 

gtc att gga ggg ctt ttg tgg ata aag gee agg gat ctg aaa ccg cgc 11764 
Val lie Gly Gly Leu Leu Trp lie Lys' Ala Arg Asp Leu Lys Pro Arg 
60 65 70 

gcc teg gag eca ttt ttg etc caa get ttg gtg* ctt gtg cac aac ctg . 11812 
Ala Ser Glu Pro Phe Leu Leu Gin Ala Leu Val Leu Val His Asn Leu 
75 80 85 90 

ttc tgt ttt gcg etc agt ctg tat atg tgc gtg ggc ate get tat cag' 11860 
Phe Cys Phe Ala Leu Ser Leu Tyr Met Cys Val Gly lie Ala Tyr Gin 
95 . .100 105 

get att acc tgg egg tac tct etc tgg ggc aat gca tac aat cct aaa 11908 
Ala lie Thr Trp Arg Tyr Ser Leu Trp. Gly Asn Ala Tyr Asn Pro Lys 
110 115 120 

cat aaa gag atg gcg att ctg gta tac ttg ttc tac atg tct aag tac 11956 
His Lys Glu Met Ala lie Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr , 

125 130 135 • i. . I 

gtg gaa ttc atg gat acc gtt ate atg ata ctg aag cgc age acc agg - .■12004 
Val Glu Phe Met Asp Thr Val lie Met lie Leu Lys Arg Ser Thr Arg 
140 145 150 

caa ata age ttc etc cac gtt tat cat cat tct tea att tec etc att 12052 
Gin He Ser Phe Leu His Val Tyr His His Ser Ser He Ser Leu He 
155 ... 160 165 170 

' i. 

tgg tgg get att get eat cac get cct ggc ggt gaa gca tat tgg tct 12100 

Trp Trp Ala He Ala His His Ala Pro Gly Gly Glu Ala Tyr Trp Ser 
175 180 185 

gcg. get ctg aac tea gga gtg cat gtt etc atg tat gcg tat tac ttc 12148 
Ala Ala Leu Asn Ser Gly Val His Val Leu Met Tyr Ala Tyr Tyr Phe 
190 195 200 

ttg get gee tgc ctt ega agt age eca aag tta aaa aat aag tac ctt 1219 B 
Leu Ala Ala Cys Leu Arg Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu* 
205 210 215 

ttt tgg. ggc agg tac ttg aca caa ttc caa atg ttc cag ttt atg ctg 12244 
Phe Trp Gly Arg Tyr Leu Thr Gin Phe Gin Met Phe Gin Phe Met Leu 
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220 225 230- 

aac tta gtg cag get tac tac gac atg aaa acg aat gcg cca tat cca 
Asn Leu Val Gin Ala Tyr Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro 
235 240 245 250 

caa tgg ctg ate aag att ttg ttc tac tac atg ate teg ttg etg ttt 
Gin Trp Leu He Lys He Leu Phe Tyr Tyr Met He Ser Leu Leu Pine 
255 260 265 

ctt ttc ggc aat ttt tac gta caa aaa tac ate aaa ccc tct gae gga 
Leu Phe Gly Asn Phe Tyr Val Gin Lys Tyr He Lys Pro Ser Asp Gly 
270 275 . - . 280 



12292 



12340 



12388 



aag caa aag gga get aaa act gag tga tctagaaggc ctcctgcttt ' 12435 

Lys Gin Lys Gly Ala Lys Thr Glu 
285 290 

aatgagatat gcgagacgcc tatgategca tgatatttgc tttcaattct gttgtgcacg 12495 

ttgtaaaaaa cctgagcatg tgtagcteag ateettaccg - ccggtttcgg tteattctaa 12555 

tgaatatatc acccgttact atcgtatttt tatgaataat attctcegtt caatttactg 12615 

attgtccgtc gagcaaattt acacattgcc actaaacgtc taaacccttg taatttgttt 12675 

ttgttttact atgtgtgtta tgtatttgat ttgcgataaa tttttatatt tggtactaaa 12735 

tttataacac cttttatgct aacgfcttgcc aacacttagc aatttgcaag ttgattaatt 12795 

gattctaaat tatttttgtc ttetaaatac atatactaat caactggaaa tgtaaatatt 12855 

tgctaatatt tctactatag gagaattaaa gtgagtgaat atggtaccac aaggtttgga 12915 

gatttaattg ttgcaatgct gcatggatgg catatacacc aaacattcaa taattcttga 12975 

ggataataat ggtaccacac aagatttgag gtgcatgaac gtcaegtgga caaaaggttt 13035 

agtaattttt caagacaaca atgttaccac acacaagttt tgaggtgcat gcatggatgc 13095 

ectgtggaaa gtttaaaaat attttggaaa tgatttgcat ggaagceatg tgtaaaacca 13155 

tgaeatccac ttggaggatg caataatgaa gaaaactaca aatttacatg caactagtta 13215 

tgcatgtagt etatataatg aggattttgc aatactttca ttcatacaca ctcactaagt 13275 

tttacacgat tataatttct tcatagccag cggatcc atg gta ttc gcg ggc ggt 13330 

Met Val Phe Ala Gly Gly 
"295 

gga ctt cag cag ggc tct etc gaa gaa aac ate gac gtc gag cae att 13378 
Gly Leu Gin Gin Gly Ser Leu GlU Glu Asn He Asp Val Glu His He 
300 305 310 

gee agt atg tct etc ttc age gac ttc ttc agt tat gtg tct tea act 13426 
Ala Ser Met Ser Leu Phe Ser Asp Phe Phe Ser Tyr Val Ser Ser Thr 
315 320 325 
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gtt ggt teg tgg age gta cac agt ata caa cat ttg aag cgc ctg acg 13474 
Val Gly Ser Trp Ser Val His Ser lie Gin Pro Leu Lys Arg Leu Thr 
330 335 340 345 

agt aag aag cgt gtt teg gaa age get gee gtg caa tgt ata tea get 13522 
Ser Lys Lys Arg Val Ser Glu Ser Ala Ala Val Gin Cys He Ser Ala 
350 355 360 

gaa gtt eag aga aat teg agt aee cag gga act gcg gag gca etc gca 13570 
Glu Val Gin Arg Asn Ser Ser Thr Gin Gly TJhr Ala Glu Ala Leu Ala 
365 * 370 375 

gaa tea gtc gtg aag ccc acg aga ega agg tea tot cag tgg aag aag 13618 
Glu Ser Val Val Lys Pro Thr Arg Arg Arg Ser Ser Gin Trp Lys Lys 
380 385 ' 390 

teg aea cac ccc eta tea gaa gta gca gta cac aac aag cca age gat 13666 
Ser Thr His Pro Leu Ser Glu Val Ala Val His Asn Lys Pro Ser Asp 

395 40Q 405 

tge tgg att gtt gta aaa aac aag gtg tat gat gtt tec aat ttt gcg 13714 
Cys Trp He Val Val Lys Asn Lys Val Tyr Asp Val Ser Asn Phe Ala 
410- 415 420 425 

gae gag eat ccc gga gga tea gtt att agt act tat ttt gga cga- gac 13762 
Asp Glu His Pro Gly Gly Ser Val He Ser Thr Tyr Phe Gly Arg Asp 
430 435 440 



ggc aea gat gtt ttc tct agt ttt cat gca get tct aca tgg aaa att 
Gly Thr Asp Val Phe Ser Ser Phe His Ala Ala Ser Thr Trp Lys He 
445 450 . 455 



13810 



dtt caa gac ttt tac att ggt gap gtg gag agg gtg gag ecg act cca 13858 
Leu Gin Asp Phe Tyr He Gly Asp Val Glu Arg Val Glu Pro Thr Pro 
460 465 470 

gag* ctg ctg aaa gat ttc ega gaa atg aga get ctt ttc ctg agg gag 13906 
Glu Leu Leu Lys Asp Phe Arg Glu Met Arg Ala Leu Phe Leu Arg Glu • 
475 480 485 

caa ctt ttc aaa agt teg aaa ttg tac tat gtt atg aag ctg etc acg 13954 
Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr Val Met Lys Leu Leu Thr 
490 495 500 505 

aat gtt get att ttt get gcg age att gca ata ata tgt tgg age aag 14002 
Asn Val Ala He Phe Ala Ala Ser He Ala He He Cys Trp Ser Lys 
510 515 520 

act att tea gcg gtt ttg get tea get tgt atg atg get ctg tgt ttc 14050 
Thr He Ser Ala val Leu Ala Ser Ala Cys Met Met Ala Leu Cys Phe 
525 530 535 

caa cag tgc gga tgg eta tec cat gat ttt etc cac aat cag gtg ttt 14098 
Gin Gin Cys Gly Trp Leu Ser His Asp Phe Leu His Asn Gin Val Phe 
540 545 550 

gag aca cgc tgg ctt aat gaa gtt gtc ggg tat gtg ate ggc aac gee 14146 
Glu Thr Arg Trp Leu Asn Glu Val Val Gly Tyr Val He Gly Asn Ala 
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555 560 565- 

gtt ctg ggg ttt agt aca ggg tgg tgg aag gag aag cat aac ctt cat 14194 

Val Leu Gly Phe Ser Thr Gly Trp Trp Lys Glu Lys His Asn Leu His 
570 575 580 585 

cat get get cca aat gaa tgc gat cag act tac caa cca att gat gaa 14242 

His Ala Ala Pro Asn Glu Cys Asp Gin Thr Tyr Gin Pro lie Asp Glu 

590 595 600 

gat att gat act etc ccc etc att gee tgg age aag gae ata ctg gee 14290 

Asp lie Asp Thr Leu Pro Leu lie Ala Trp Ser Lys Asp lie Leu Ala 
605 610 615 

aca gtt gag aat aag aca ttc ttg cga ate etc caa tac cag cat ctg 14338 

Thr Val Glu Asn Lys Thr Phe Leu Arg lie Leu Gin Tyr Gin His Leu 
620 625 630 

ttc ttc atg ggt ctg tta ttt ttc gee cgt ggt agt tgg etc ttt tgg 14386 

Phe Phe Met Gly Leu Leu Phe Phe Ala Arg Gly Ser Trp Leu Phe' Trp 
635 640 645 

age tgg aga tat acc tct aca gca gtg etc tea ect gte gae agg ttg 14434 

Ser Trp Arg Tyr Thr Ser Thr Ala Val Lau Ser Pro Val Asp Arg Leu 
650 655 660 665 

ttg gag aag gga act gtt ctg ttt eac tac ttt tgg ttc gtc ggg aca 14482 

Leu Glu Lys Gly Thr Val Leu Phe Hie Tyr Phe Trp Phe val Gly Thr 

670 675 680 

gcg tgc tat ctt etc ect ggt tgg aag cca tta gta tgg atg gcg gtg 14530 

Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro Leu Val Trp Met Ala Val 
685 690 695 

act gag etc atg tee ggc atg ctg ctg ggc ttt gta ttt gta ctt age 14578 

Thr Glu Leu Met Ser Gly Met Leu Leu Gly Phe Val Phe Val Leu Ser 
•700 705 710 

; i 

eac aat ggg atg 'gag gtt tat aat teg tct aaa gaa- ttc gtg agt gea •14626 

His Asn Gly Met Glu Val Tyr Asn Ser ser Lys Glu Phe val Ser Ala 

715 720 725 

cag ate gta tec aca egg gat ate aaa gga aac ata ttc aac gae tgg 14674 

Gin He Val Ser Thr Arg Asp He Lys Gly Asn He Phe Asn Asp Trp 
730 735 740 745 

ttc act ggt ggc ctt aac agg caa ata gag cat cat ctt ttc cca aca 14722 

Phe Thr Gly Gly Leu Asn Arg Gin He Glu His His Leu Phe Pro Thr 

750 755 760 

atg ccc agg cat aat tta aac aaa ata gca cet aga gtg gag gtg ttc 14770 

Met Pro Arg His Asn lieu Asn Lys He Ala Pro Arg Val Glu Val Phe 
765 770 775 

tgt aag aaa eac ggt ctg gtg tac gaa gae gta tct att get acc ggc 14818 

Cys Lys Lys His Gly Leu Val Tyr Glu Asp Val Ser He Ala Thr Gly 
780 785 ■ 790 
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act tgc aag gtfc ttg aaa gca ttg aag gaa gtc gcg gag get gcg gca 14866 
Thr Cys Lys Val Leu Lys Ala Leu Lys Glu Val Ala Glu Ala Ala Ala . 
795 800 805 

gag cag cat get acc acc agt taa gctagcgtta accctgcttt aatgagatat 14920 
Glu Gin His Ala Tiir Thr Ser 
810 815 



gcgagacgcc 


tatgatcgca 


tgatatttgc 


tttcaattct 


gttgtgcacg 


ttgtaaaaaa 


14980 


cctgagcatg 


.tgtagctcag 


atqcttaccg 


ccggtttcgg 


ttcattctaa 


tgaatatatc 


15040 


acccgttact 


atcgtatttt 


tatgaataat 


attctccgtt 


caatttactg 


attgtccgtc 


15100 


gagcaaattt 


acacattgcc 


actaaacgtc 


taaacccttg 


taatttgttt 


ttgttttact 


15160 


atgtgtgtta 


tgtatttgat 


ttgcgataaa 


tttttatatt 


tggtactaaa 


tttataacac 


15220 


cttttatgct 


aacgtttgcc 


aacacttagc 


aatttgcaag 


ttgattaatt 


gattctaaat 


15280 


tatttttgtc 


ttctaaatac 


atatactaat 


caactggaaa 


tgtaaatatt 


tgctaatatt 


15340 


tctactatag 


gagaattaaa 


gtgagtgaat 


atggtaccac 


aaggtttgga 


gatttaattg 


15400 


ttgcaatgct 


gcatggatgg 


catatacacc 


aaacattcaa 


taattcttga 


ggataataat 


15460 


ggtaccacac 


aagatttgag 


gtgcatgaac 


gtcacgtgga 


ceiaaaggttt 


agtaattttt 


15520 


caagacaaca 


atgttaccac 


acacaagttt 


tgaggtgcat 


gcatggatgc 


cctgtggaaa 


15580 


gtttaaaaat 


attttggaaa 


tgatttgcat 


ggaagccatg 


tgtaaaacca 


tgacatccac 


15640 


ttggaggatg caataatgaa 


gaaaactaca 


aatttacatg 


caactagtta 


. tgcatgtagt 


15700 


ctatataatg aggattttgc. 


aatactttca 


ttcatacaca 


ctcactaagt 


tttacacgat 


15760 


tataatttct 


tcatagccag 


cagatctaaa 


atg get ccg gat gcg gat aag ctt 
Met Ala Pro Asp Ala Asp Lys Leu 


15814 



820 825 

cga caa cgc cag acg act gcg gta gcg aag cac aat get get acc ata 15862 
Arg Gin Arg Gin Thr Thr Ala Val Ala Lys His Asn Ala Ala Thr He 
830 835 840 

teg acg cag gaa cgc ctt tgc agt ctg tct teg etc aaa ggc gaa gaa 15910 
Ser Thr Gin Glu Arg Leu Cys Ser Leu Ser Ser Leu Lys 'Gly Glu Glu- 
845 850 855 

gtc tgc ate gac gga ate ate tat gac etc caa tea tte gat cat ccc 15958 
Val Cys He Asp Gly He He Tyr Asp Leu Gin Ser Phe Asp His Pro 
860 865 '870 

ggg ggt gaa acg ate aaa atg ttt ggt ggc aac gat gtc act gta cag 16006 
Gly Gly Glu Thr He Lys Met Phe Gly Gly Asn Asp Val Thr Val Gin 
875 880 885 



tac 
Tyr 



aag atg att cac ccg tac cat acc gag aag cat ttg gaa 
Lys Met He His Pro Tyr His Thr Glu Lys His Leu Glu 



aag atg 
Lys Met 



16054 
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890 



895 



900 



905 



aag cgt gtc ggc aag gtg acg gat ttc gtc tgc gag tac aag ttc gat 16102 
Lys Arg Val Gly Lys val Thr Asp Phe Val Cys Glu Tyr Lys Phe Asp 
910 915 920 

acc gaa ttt gaa cgc gaa ate aaa cga gaa gtc ttc aag att gtg cga 16150 
Thr Glu Phe Glu Arg Glu He Lys Arg Glu Val Phe Lys He val Arg 
. 925 930 935 

cga ggc aag gat ttc ggt act ttg gga tgg ttc ttc cgt gcg ttt tgc 16198 
Arg Gly Lys Asp Phe Gly Thr Leu Giy Trp Phe Phe Arg Ala Phe Cys 
940 945 950 

tac att gcc att ttc ttc tac ctg cag tac cat tgg gtc acc acg gga 16246 
Tyr He Ala He Phe Phe Tyr Leu Gin Tyr His Trp Val Thr Thr Gly 
955 960 965 

acc tct tgg ctg ctg gcc gtg gcc tac gga ate tec caa gcg atg att 16294 
Thr Ser Trp Leu Leu Ala Val Ala Tyr Gly He Ser Gin Ala Met He 
970 975 980 985 

ggc atg aat gtc cag cac .gat gcc aac cac ggg gcc acc tec aag cgt 16342 
Gly Met Asn Val Gin His Asp Ala Asn His Gly Ala. Thr Ser Lys Arg 
990 995 1000 

ccc tgg gtc aac gac atg eta ggc etc ggt gcg gat ttt att ggt ggt 16390 
Pro Trp Val Asn Asp Met Leu Gly Leu Gly Ala Asp Phe He Gly Gly 
1005 1010 1015 

tec aag tgg etc tgg cag gaa caa cac tgg acc cac cac get tac acc 16438 
Ser Lys Trp Leu Trp Gin Glu Gin His Trp Thr His His Ala Tyr Thr 
1020 1025 . 1030 

aat cac gcc gag atg gat ccc gat age ttt ggt gcc gaa eca atg etc 16486 
Asn His Ala Glu Met Asp Pro Asp Ser Phe Gly. Ala Glu Pro Met Leu 
1035 1040 • 1045 

eta ttc aac gac tat ccc ttg gat. cat ccc get cgt acc tgg eta cat 16534 
Leu Phe Asn Asp Tyr Pro Leu Asp His Pro Ala Arg Thr Trp Leu His 

1050 1055 1060 1065 

cgc ttt caa gca ttc ttt tac atg ccc gtc ttg get gga tac tgg ttg 16582 
Arg Phe Gin Ala Phe Phe Tyr Met Pro Val Leu Ala Gly Tyr Trp Leu 
1070 1075 1080 



tec get gtc ttc aat cca caa att ctt gac etc cag caa cgc ggc gca 
Ser Ala val Phe Asn Pro Gin He Leu Asp Leu Gin Gin Arg Gly Ala 
1085 1090 1095 



16630 



ctt tec gtc ggt ate cgt etc gac aac get ttc att cac teg cga cgc 
Leu Ser Val Gly He Arg Leu Asp Asn Ala Phe He His Ser Arg Arg 
1100 1105 ■ 1110 



16678 



aag tat gcg gtt ttc tgg egg get gtg tac att gcg gtg aac gtg att 
Lys Tyr Ala Val Phe Trp Arg Ala Val Tyr He Ala Val Asn Val He 
1115 1120 1125 



16726 
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get ccg ttt tac aca aac tec ggc etc gaa tgg tec tgg cgt gte ttt 
Ala Pro Phe a?yr Thr Asn Ser Gly Leu Glu Trp Ser Trp Arg Val Phe 
1130 1135 1140 1145 



16774 



gga aac ate atg etc atg ggt gtg geg gaa teg . etc gcg ctg gcg gtc 
Gly Asn lie Met Leu Met Gly Val Ala Glu Ser Leu Ala Leu Ala Val 
1150 1155 1160 



16822 



ctg ttt teg ttg teg cae aat ttc gaa tec gcg gat egc gat ccg ace 
Leu Phe Ser Leu Ser His Asn Phe Glu Ser Ala Asp Arg Asp Pro Ohr 
1165 1170 • 1175 



16870 



gee eca ctg aaa aag acg gga gaa cca gtc gac tgg ttc aag aca cag 
Ala Pro Leu Lys Lys Thr Gly Glu Pro Val Asp Trp Phe Lys Thr Gin 
1180 1185 1190 



16918 



gtc gaa act tec tgc act tac ggt gga ttc ett tec ggt tgc ttc acg 
Val Glu Thr Ser Cys Thr Tyr Gly Gly Phe Leu Ser Gly Cys Phe Thr 

1195 1200 1205 



16966- 



gga ggt etc aac ttt cag gtt gaa cae cac ttg ttc cca egc atg, age 
Gly Gly Leu Ash Phe Gin Val Glu His His Leu Phe Pro Arg Met Ser 
1210 1215 1220 1225 



17014 



age get tgg tat cec tac att gee ece aag gtc egc gaa att tgc gcc 
Ser Ala Trp Tyr Pro Tyr lie Ala Pro Lys Val Arg Glu lie Cys Ala 
1230* 1235 1240 



17062 



aaa cac ggc gtc cac tac gee tac tac ccg tgg ate cac caa aac ttt 
Lys His Gly Val His Tyr Ala Tyr Tyr Pro Trp He His Gin Asn Phe 
1245 1250 1255 



17110 



etc tec ace gtc egc tac atg cac geg gcc ggg ace ggt gee aac tgg 17158 
Leu Ser Thr Val Arg Tyr Met His Ala Ala Gly Thr Gly Ala Asn Trp 
1260 • 1265 1270 

egc cag atg gcc aga gaa aat cec ttg ace gga egg gcg taa 17200 
Arg Gin Met Ala Arg Glu Asn Pro Leu Thr Gly Arg Ala 



1275 




1280 


1285 




agate tgccg 


gcatcgatee 


cgggccatgg 


cetgetttaa 


tgagatatge 


gagaegccta 17-260 


tgatcgcatg 


atatttgctt 


tcaattctgt 


tgtgcacgtt 


gtaaaaaacc 


tgagcatgtg 17320 


tagetcagat 


ccttaecgcc 


ggtttcggtt 


cattctaatg 


aatatatcac 


cegttactat 17380 


cgtattttta 


tgaataatat 


tctccgttea 


atttaetgat 


tgtccgtcga 


cgagcteggc 17440 


gcgcctctag 


aggatcgatg 


aattcagatc 


ggctgagtgg 


ctccttcaac 


gttgcggttc 17500 


tgtcagttce 


aaacgtaaaa 


eggcttgtec 


egegtcatcg 


gegggggtca 


taacgtgact 17560 


cccttaattc 


tccgctcatg 


atcagattgt 


cgtttccege 


ettcagttta 


aactateagt 17620 


gtttgacagg 


atatattggc 


gggtaaacct 


aagagaaaag 


agegtttatt 


agaataateg 17680 


gatatttaaa 


agggcgtgaa 


aaggtttatc 


ettcgtceat 


ttgtatgtgc 


atgecaacca 17740 



cagggttccc ca 



105 



17752 



<210> 29 

<211> 290 
<212> PRT 
<213> Unloiown 



<400> 29 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 

1 5 10 • ' 15 

Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20 . .25 30 

Thr Pro Thr Jhr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro He 
35 .40 45 • 

Val Leu Gly Vad Ser Val Tyr Leu Thr He Val He Gly Gly Leu Leu 
50 55 60 • 

Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu 
65 70 . 75 .80 

Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 

85 90. . 95 

Leu lyr Met Cys Val Gly He Ala Tyr Gin Ala He Thr Trp Arg Tyr 
100 105 110 

Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala He 
115 120 125 

Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 .135 140 

Val He Met He Leu Lys Arg Ser Thr Arg Gin He Ser Phe Leu His 
145 150 ■ 155 160 

Val Tyr His His Ser Ser He Ser Leu He Trp Trp Ala. He Ala His 
165 170 175 

His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
180 . 185 190 

Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
195 200 205 

Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
210 • 215 220 

Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 

225 230 235 240 



Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu He Lys He 
245 250 255 



Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 



260 



265 



270 



Val Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 



Thr Glu 
290 



<210> 30 
<211> 525 
<212> PRT 
<213> Unloiown 

<400> 30 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
1 5 . . 10 . 15 

He Asp Val Glu His He Ala Ser Met Ser Leu Phe Ser Asp Phe Phe. 
20 25' 30 

Ser Tyr Val Ser Sar Thr Val Gly Ser Trp Ser Val His Ser He Gin 
35 .40 45 . 

Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
50 * 55 €0 

Val Gin Cys He Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
65 .70 .75 \'\ 80 

Thr Ala Glu Ala Leu Ala' Glu Ser Val Val Lys Pro Thr Arg Arg Arg 
85 . 90 . i 95 

Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
100 • . 105 110 

His Asn Lys Pro Ser Asp Cys Trp He Val Val Lys Asn Lys Val Tyr 

115 . 120 125 

Asp Val Ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser Val He Ser 
130 135 140 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 
145 150 . 155 160 

Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
165 170 175 

Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
180 • 185 190 

Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
195 200 205 • 

Val Met Lys Leu Leu Thr Asn- Val Ala He Phe Ala Ala Ser He Ala 
210 215 220 

He He Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 



225 



230 
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235 



240 



Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 

245 250 255 

Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 

260 265 270 

Tyr Val lie Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 

275 28D 285 

Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 

290 295 300 

Tyr Gin Pro He Asp Glu Asp He Asp Thr Leu Pro Leu He Ala Trp 

305 310 315 320 

. Ser Lys Asp He Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 

325 33.0 335 

Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 

340 - 345 . 350 

Gly Ser Trp Leu Phe Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu 

355 360 365 

Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 

370 375 380 

Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 

.385 390 395 400 

Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 

405 410 415 

Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 

420 425 430 

" Lys Glu Phe Val Ser Ala Gin He Val, Ser Tfar Arg Asp lie Lys Gly 

435 440 445 

Asn He Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin He Glu 

450 ■ 455. 460 

His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 

465 470 475 480 

Pro Arg val Glu Val Phe Cys Lys Lys His Gly Leu Vai Tyx Glu Asp 

485 ^ 490 495 

Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 

500 505 510 



Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
515 520 525 



<210> 31 
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<211> 469 
<212> PRT 
<213> Unknown 

<400> 31 

Met Ala Pro Asp Ala Asp hys Leu Arg Gin Arg Gin Thr Thr Ala Val 
15 10 15 

Ala Lys His Asn Ala Ala Olir lie Ser Oto Gin Glu Arg Leu Cys Ser 
20 25 30 

Leu Ser Ser Leu Lys Gly Glu Glu Val Cys He Asp Gly He He Tyr 

35 '40 - 45 ■ . . 

Asp Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr He Lys Met Phe 
50 55 60 

Gly Gly Asn Asp val Thr val Gin Tyr Lys Met He His Pro Tyr His 
.65 70 75 80 

Thr Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp 
85 90 . 95 

Phe Val Cys Glu Tyr Lys Phe Asp Thr Glu Phe Glu Arg Glu He Lys 
100 105 110 

Arg Glu Val Phe Lys He Val Arg Arg Gly Lys Asp Phe Gly Thr Leu 
115 120 125 

Gly Trp Phe Phe Arg Ala Phe Cys Tyr He Ala He Phe Phe Tyr Leu 
130 135 ' 140 

Gin Tyr His Trp Val Thr Thr Gly Thr- Ser Trp Leu Leu Ala Val Ala 
145 150 155 160 

Tyr Gly He Ser Gin Ala Met He Gly Met Asn Val Gin His Asp Ala 
165 170 175 

Asn His Gly Ala Thr Ser Lys Arg Pro Txp Val Asn Asp Met Leu Gly 
180 185 190 

Leu Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin 
195 200 205 

His Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp 
210 215 220 

Ser Phe Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp 
225 230 235 240 

His Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met 
245 250 255 

Pro Val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He 
260 265 270 



Leu Asp 



Leu Gin Gin 
275 



Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp 
280 285 
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Asn Ala Phe lie His Ser Arg Arg Lys Tyr Ala val Phe Trp Arg Ala 
290 295- 300 

Val Tyr lie Ala Val Asn val lie Ala Pro Phe Tyr Thr Asn Ser Gly 
305 310 315 320 " 

Leu Glu Trp Ser Trp Arg Val Plie Gly Asn He Met Leu Met Gly Val 
325 330 335 

Ala Glu Ser Leu Ala- Leu Ala Val Leu Phe Ser Leu Ser His Asn Phe 
340 345 350 

Glu Ser Ala Asp Arg Asp Pro "rfir Ala Pro Leu Lys Lys Thr Gly Glu 
355 360 365 

Pro Val Asp Trp Phe Lys Thr Gin Val Glu Thr Ser Cys Thr Tyr Gly 
370 -375 , 380 

Gly Phe Leu Ser Gly Cys Phe Thr Gly Gly Leu Asn Phe Gin Val Glu 
385 390 395. 400 

His His Leu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr He Ala 
405 410 415 

Pro Lys Val Arg Glu He Cys Ala Lys His Gly Val His Tyr Ala Tyr 
420 425 430 

Tyr Pro Trp He His Gin Asn Phe Leu Ser Thr Val Arg Tyr Met His 
435* 440 445 

Ala Ala ^Gly Thr* Gly Ala Asn Trp Arg Gin Met Ala Arg Glu Asn Pro 
450 455 460 

Leu Thr Gly Arg Ala 

465 . - ' 



<210> 32 
<211> 26 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Polylinker 
<400> 32 

gaattcggcg cgccgagctc ctcgag 



<210> 33 
<211> 265 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Polylinker-Terminator-Polyl inker 
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<400> 33 

ccaccgcggt gggcggccgc ctgcagtcta gaaggcctcc tgctttaatg agatatgcga 60 
gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 120 
agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 180 
gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg tccgtcgacg 240 
aattcgagct cggcgcgcca agctt 265 

<210> 34 
<211> 257 
<212> DNA 

<213> Artificial Sequence 
<220>* 

<223> Polyliiiker-Terminator-Polylinker 
<400> 34 * • 

ggatccgata tcgggcccgc tagcgttaac cctgctttaa tgagatatgc gagacgccta 60 
tgatcgcatg atatttgctt tcaattctgt tgtgcacgtt gtaaaaaacc tgagcatgtg 120 
tagctcagat ccttaccgcc ggtttcggtt cattctaatg aatatatcac ccgttactat 180 
cgtattttta .tgaataatat tctccgttca atttactgat tgtccgtcga cgaattcgag 240 
ctcggcgcgc caagctt 257 

<2ia> 35 
<211> 257 
<212> DNA 

<213> Artificial Secjuence 
<220> 

<223> Polylinker-Terminator-Polylinker 
<400> 35 

agatctgccg gcatcgatcc cgggccatgg cctgctttaa tgagatatgc gagacgccta 60 
tgatcgcatg atatttgctt tcaattctgt tgtgcacgtt gtaaaaaacc tgagcatgtg 120 
tagctcagat ccttaccgcc ggtttcggtt cattctaatg aatatatcac ccgttactat 180 
cgtattttta tgaataatat tctccgttca atttactgat tgtcccrtcga cgaattcgag 240 
ctcggcgcgc caagctt 257 



